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Prólogo 


Es un placer introducir esta colección de artículos científicos 
del área de Ciencia y Tecnología de la Universidad Politécnica Sale- 
siana, trabajo presentado desde las ingenierías: Electricidad, Elec- 
trónica y Automatización, Civil, Computación, Telecomunicaciones 
y Biomedicina. 

El mundo ha avanzado con la llegada de la ciencia y tecno- 
logía. Satisfacer las necesidades de la sociedad, con una visión de 
innovación, se ha convertido en un reto para el campo científico. 

El camino para llegar a un concepto de ciudades inteligen- 
tes, por ejemplo, puede conjugar varias aristas que dan cuenta de 
un aporte de diversas competencias y destrezas por parte de la 
comunidad científica; de esta manera, podemos encontrar aportes 
en redes eléctricas inteligentes, servicios de comunicación masiva, 
aprovechamiento de los recursos hídricos, análisis de ondas sísmi- 
cas, manejo de datos en la nube o la interpretación de imagen para 
aplicaciones médicas, cumpliendo así una vasta demanda de opor- 
tunidades para la generación de nuevo conocimiento que aporta la 
ciencia y tecnología en favor de la sociedad. 

Este libro presenta los resultados y esfuerzos en investiga- 
ción básica y aplicada en un contexto articulado en Aplicaciones e 
innovación de ingeniería en ciencia y tecnología, relacionados con 
aspectos importantes en el área de energía, electrónica, civil, com- 
putación, telecomunicaciones y biomedicina. 

El trabajo incluye documentos seleccionados sobre la base de 
la originalidad, importancia y claridad en el tema. Esperamos que 
personas de la academia y de la industria encuentren en este libro 
herramientas para el desarrollo de nuevas investigaciones sobre los 
aportes que se pueden conseguir desde la ingeniería contribuyendo 
con la sociedad, la ciencia y la tecnología. 

Este trabajo no se podría haber llevado a cabo sin el apoyo de 
muchas personas de la Universidad Politécnica Salesiana que siem- 


pre están en búsqueda del desarrollo del conocimiento como un bien 
de uso común. 


Introducción 


Las carreras de ingenierías de la Universidad Politécnica Sale- 
siana Sede Quito en conformidad con las necesidades expuestas en el 
plan nacional de desarrollo en relación con el contexto y necesidades 
propias de la sociedad ecuatoriana y mundial, realizan una exposición 
de los avances científicos en ciencia y tecnología brindando un aporte 
basado en investigación básica y aplicada con el que se da solución a 
problemas de ingeniería con aporte y responsabilidad social. 

A continuación, se esbozan los contenidos que abarca este 
libro: 

Capítulo 1: Desarrolla un modelo matemático heurístico para 
despliegue de redes inalámbricas heterogéneas que brindarán la 
conectividad de los medidores inteligentes de energía eléctrica; 
adicionalmente el trabajo incluye el despliegue de una red de distri- 
bución eléctrica; en ambos casos se minimizan los costos por el uso 
de recursos tanto para la red de comunicaciones inalámbrica como 
para la red eléctrica. 

Capítulo II: Presenta un modelo para localización de fallas en 
sistemas de distribución eléctrica que permita reducir las pérdidas 
por energía no facturada; además con este modelo se busca aumen- 
tar la confiabilidad del sistema. El trabajo entonces presenta una 
revisión de métodos para localizar fallas en los sistemas eléctricos 
de distribución eléctrica con presencia de fuentes de generación 
distribuida. 

Capítulo III: Presenta una metodología para cuantificar la 
intercepción de neblina a través de un sistema de captación y eva- 
luar su potencial como fuente de agua. Se trabaja con tres tipos de 
colectores de neblina. Se analizan las variables meteorológicas con 
el que cada colector se relaciona para un rendimiento mayor del 
colector de acuerdo a las condiciones del clima. 

Capítulo IV: Presenta una metodología para estudios de sitio 
para determinar la degradación de rigidez y resistencia de los sue- 
los, la evaluación del potencial de licuación de arenas, niveles de 


deformación en los estratos de suelos y el espectro de diseño para su 
posterior uso en el análisis dinámico de estructuras. De esta manera, 
se pueden construir estructuras dúctiles que pueden experimentar 
grandes deformaciones sin pérdida de resistencia para que no colap- 
sen ante un sismo severo. 

Capítulo V: Se presenta una arquitectura destinada a integrar 
sistemas embebidos FPGA que poseen menor consumo de energía 
como acelerador en un Cloud privado. Para verificar su rendimiento 
se tiene en cuenta la calidad del servicio logrando una combinación 
adecuada entre CPU y FPGA en un entorno Cloud. 

Capítulo VI: Se advierte un despliegue de una red de fibra 
óptica en una zona urbana para un número considerable de usuarios 
del tipo residencial y corporativo y así satisfacer la demanda por 
ancho de banda. El modelo considera escalabilidad y una inversión 
redituable. El modelo considera distintos tipos y estándares de redes 
de fibra óptica. 

Capítulo VII: Se presenta un aporte desde la Telemedicina en 
la cual se considera el tratamiento de imágenes para un correcto 
diagnóstico médico desde un análisis visual. Se presenta un esque- 
ma de clasificación automática de nódulos para diferentes proyec- 
ciones mamográficas. El modelo propuesto se encarga de fusionar la 
información y clasificar nódulos malignos y benignos. Información 
adecuada para los profesionales encargados de radiología. 
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Óptima planeación de recursos para 
redes eléctricas inteligentes usando 
modelos heurísticos 


Optimal Planning of Resources for Smart 
Grid using Heuristic Methods 
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Universidad Politécnica Salesiana Ecuador 
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Resumen 


El presente trabajo considera una planificación de redes inalámbricas heterogéneas 
para proporcionar medición inteligente dentro de una red de área vecina con su res- 
pectiva conectividad con la oficina central de una compañía de distribución eléctrica. 
Además, el trabajo presenta un modelo de planificación para lograr una red de distri- 
bución eléctrica subterránea en un área definida. Tanto la red inalámbrica heterogénea 
como la red de distribución se implementan en un área georeferenciada real y permi- 
ten minimizar el costo por el uso de recursos de telecomunicaciones y eléctricos; de 
esta forma, se logra el concepto de una red eléctrica inteligente eficiente al minimizar 
los costos y aumentar la confiabilidad de la red considerando las restricciones de capa- 
cidad y la cobertura del usuario. 


Palabras claves 


Sistemas eléctrico de distribución; optimización; planeación; medición inteligente; 
redes eléctricas inteligentes 


Abstract 


The present work considers a planning of heterogeneous wireless networks to provide 
smart metering within a neighborhood area network with its respective connectivity with 
the central office of an electricity distribution company. In addition, a planning model is 
present to achieve an underground electrical distribution network in a defined area. Both 
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the wireless heterogeneous network and the distribution network are deployment over a 
real georeferenced area and allow minimizing the cost by use of telecommunications and 
electrical resources; in this way, the concept of an efficient intelligent electric network is 
meet by minimizing costs and increasing reliability of the network considering capacity 
restrictions and user coverage. 


Keywords 


Electrical distribution system; optimization; planning; smart metering; smart grid. 


1. Introducción 


Para facilitar la conversión de una red eléctrica convencional 
a una red eléctrica inteligente es necesario incluir un sistema de 
comunicaciones que permitan el intercambio de información bidirec- 
cional [1],[2]. El presente trabajo se enfoca en la infraestructura de 
medición inteligente de energía eléctrica; para lo cual, se requiere la 
conectividad entre el medidor inteligente de cada usuario y la oficina 
central de una empresa eléctrica, logrando una medición inteligente 
del suministro eléctrico que se provee a cada usuario o cliente por 
parte de una empresa de distribución eléctrica [3]. 

La infraestructura de medición inteligente podrá estar formada 
de varias subredes con diferentes tecnologías de comunicación para 
cada caso, así tenemos que la red de área doméstica estará dedicada 
al intercambio de información entre el medidor inteligente y los sen- 
sores ubicados en el interior de la vivienda, esta información podrá 
ser utilizada para caracterizar el consumo de cada usuario de manera 
particular, en este punto, un detalle importante se relaciona a la segu- 
ridad de la información, que aunque no está involucrado en el presen- 
te trabajo, debe preocupar a las empresas eléctricas y a los usuarios, 
ya que, podría sufrir ataques de parte de la delincuencia y con este 
conocer el estado y hasta el número de dispositivos electrónicos que 
posee un cliente, tiempo de uso, tarifa de pago, etc., [4], [5]. 

A continuación, se desprende la red de área vecindaria, pilar 
fundamental de este trabajo, donde se encuentra la mayor nece- 
sidad de optimizar los recursos, ya que, los usuarios podrán estar 
ubicados en zonas urbanas con mayor cercanía entre una red de 
comunicaciones; existente en relación con una zona suburbana, 
pero también estarán las zonas rurales con baja penetración de la 
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red de comunicaciones y requerirá que los recursos de tecnología 
de comunicaciones sea la idónea. En todos los casos anteriores se 
deberá tener una planeación adecuada que permita una rápida ins- 
talación de medidores inteligentes, pero de forma escalable; de esta 
manera se garantiza que el costo por recursos sea el mínimo. Los cri- 
terios de partida para iniciar el despliegue no solo podrán depender 
de atacar zonas donde existe mayor robo o hurto de energía eléc- 
trica, sino que, a qué tipo de zona se refiere y qué característica en 
disponibilidad de tecnología de comunicaciones existe para determi- 
nar el hardware que deberá disponer un medidor inteligente. De lo 
antes mencionado, es prescindible resaltar que una única solución 
de comunicaciones no es viable, sino que, puede existir múltiples 
soluciones y con el menor costo [6],[7]. 

La red de área amplia encargada de la conectividad entre los 
medidores inteligentes con la empresa de distribución eléctrica pasa 
a formar una zona de frontera debido al requerimiento de concen- 
tradores que aglutinarán información proveniente de un conjunto de 
medidores inteligentes y a su vez permite el intercambio de informa- 
ción o enlace de última milla con una estación base celular, elemento 
que finalmente enlaza o envía información con la oficina central [8]. 

Tal como se aprecia el envío de información desde un medidor 
inteligente a una empresa de distribución eléctrica toma el nombre 
de enlace ascendente, pero se debe tener presente que la información 
puede ser descendente debido a que la medición inteligente también 
permite cortes y reconexiones del suministro eléctrico con lo que a 
través de la información recibida se activa o desactiva el sistema elec- 
trónico del medidor inteligente y así se permite o no el paso del sumi- 
nistro eléctrico a la vivienda del cliente [9],[10].Como complemento 
a la planeación de la red de comunicaciones para medición inteligente 
es primordial dotar de un modelo que permita, en la misma zona 
georreferenciada, el dimensionamiento de una red eléctrica capaz de 
proporcionar mapas de rutas óptimos con la finalidad de construir 
redes eléctricas, ya sean: soterradas, aéreas o en su defecto mixtas 
muy pertinentes para facilitar que la red eléctrica inteligente consiga 
confiabilidad y calidad del suministro [11]-[15]. 

La creciente demanda por el incremento de cargas significati- 
vas a la red eléctrica de distribución existente, como: introducción 
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de cocinas de inducción, calentamiento de agua, incremento de 
nuevos usuarios a la red eléctrica o por la integración de vehículos 
eléctricos en un inmediato próximo [16] hace que, la necesidad de 
redimensionar equipos eléctricos de potencia reconsiderando capa- 
cidades nominales de corriente en los conductores y otras variables 
eléctricas sensibles al incremento de la demanda sean nuevamente 
analizados para garantizar un servicio eléctrico de calidad y confia- 
ble [17]1,[18]. En redes eléctricas nuevas, se debe planificar consi- 
derando las demandas tipo actualizadas que contemplan la energía 
demandada por cocción y calentamiento de agua. Por lo tanto, se 
propone implementar una heurística capaz de solucionar el proble- 
ma de planeación en redes eléctricas de distribución considerando 
restricciones de cobertura lineal y capacidad de albergar usuarios en 
los transformadores de distribución a emplazarse en sitios georre- 
ferenciados, determinados por la heurística, garantizando satisfacer 
el máximo porcentaje de observabilidad a los usuarios sin descuidar 
los principios técnicos de calidad y seguridad energética. El modelo 
será implementado en el software Matlab y mediante el software 
Cymdist se analizará el flujo de potencia resultante obtenido del 
mapa de ruta lograda por la heurística propuesta. 

El modelo de planeación de redes de distribución es capaz 
de proporcionar datos de mucho interés para iniciar un despliegue 
óptimo en una red eléctrica de distribución nueva, tales como: can- 
tidad de transformadores por cada capacidad en kVAs requerido 
en el despliegue, caídas de voltaje máximos en cada transformador 
emplazado y capacidad máxima requerida en la subestación para 
satisfacer la demanda total. Además, el modelo admite parámetros 
reales de diseño, tales como: kVA-m soportado por el conductor a 
utilizarse en bajo voltaje, demandas por cada usuario identificando 
a qué estrato pertenece, estandarización de transformadores y dis- 
tancia promedio en la que se debe emplazar los pozos en una red 
eléctrica soterrada o los postes en una red eléctrica aérea. El modelo 
da solución al problema de planeación aplicando teoría de grafos y 
enrutamiento de mínima y máxima expansión [19], garantizando 
así, proporcionar topologías al menor costo. 

El análisis eléctrico obtenido del software Cymdist, tomado en 
cuenta, el despliegue y datos obtenidos por la heurística propuesta 
conocido en la literatura como modelo de red de referencial [20], 


Esteban Inga y Miguel Campaña 


contribuirá de manera óptima a la toma de decisiones garantizando 
una red eléctrica segura y resiliente al menor costo de implementa- 
ción. El algoritmo de planeación y despliegue de una red eléctrica de 
distribución consta de cinco procedimientos. El primer procedimien- 
to consiste en levantar la información necesaria georreferenciada de 
un archivo OSM obtenido de OpenStreetMap, el mismo que, contie- 
ne la información necesaria de las coordenadas (latitud y longitud) 
de calles, viviendas, parques, etc. 

En el segundo procedimiento se genera múltiples escenarios 
de conectividad observando las restricciones anteriormente men- 
cionadas con técnicas de clusterización basado en una variante del 
algoritmo de PRIM. Mediante el algoritmo del Setcover se procede, 
en el paso tres, a seleccionar el mínimo número de subconjuntos de 
conectividad que contengan el mayor número de elementos, para 
así, proporcionar una solución cercana a la óptima. 

En consecuencia, la solución obtenida por la heurística, no se 
basa en la topología de una red inicial, sino que, se basa en la con- 
jugación de varias soluciones, de tal manera que, se busca garantizar 
una solución óptima global. 

En el procedimiento cuatro, se eliminan elementos redun- 
dantes de los subconjuntos seleccionados por el algoritmo Setcover, 
posteriormente, de cada subconjunto o agrupación, bajo el criterio 
del centro de masa, se selecciona la ubicación del transformador a 
emplazarse y se procede a construir un árbol de mínima expansión, 
mediante el algoritmo de Dijkstra entre los primarios de los trans- 
formadores habilitados dando origen a la red de medio voltaje y el 
mismo criterio de aplica en los secundarios, con cada agrupación, 
para formar la red de bajo voltaje, a diferencia que, se emplea un 
árbol de máxima expansión con la finalidad de considerar a todas 
las viviendas de cada subconjunto para el tendido eléctrico desde los 
secundarios de los transformadores de distribución hacia sus nodos 
de servicio más lejanos. Por último, se procede a calcular las caídas 
de voltaje en cada transformador emplazado (desde la fuente hacia 
el nodo más lejano). 

En adelante este artículo se organiza de la siguiente manera. 
En la sección 2 se introduce el modelo de planeación para redes de 
comunicaciones inteligente y para redes eléctricas de distribución. 
En la sección 3 se describe la formulación del problema para una red 
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heterogénea inalámbrica y la red eléctrica de distribución soterrada. 
En la sección 4 se analizan los resultados de la modelización y simu- 
lación de los algoritmos de planeación. Finalmente, concluimos este 
artículo en la sección 5. 


2. Planeación Óptima de Redes 


A. Red heterogénea inalámbrica para medición inteligente 

Si consideramos medidores inteligentes de energía eléctrica 
con intervalos de lectura cada 15 minutos, en 24 horas tendríamos 
96 lecturas por día y en un mes 2880 lecturas. Por otro lado, si se 
considera que cada lectura representa 5 bytes; en un escenario de 
4'000.000 de abonados, al multiplicar por 5 bytes nos genera una can- 
tidad aproximada a 20'000.000 bytes por lectura. La Tabla 1, muestra 
el crecimiento de la información para un intervalo entre cada lectura 
[211,111], [22]. El concepto de los recursos requeridos por la infraes- 
tructura de medición avanzada se avizora en la Figura 1, de acuerdo 
a este modelo se incorporan concentradores o puntos de agregación 
de datos (PAD) que permitirán la conectividad con las estaciones base 
celular y de esta manera se reducen los costos al incorporar tecnología 
inalámbrica con un costo menor a la tecnología celular. 
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Figura 1. Infraestructura de medición avanzada usando redes inalámbricas 
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Tabla 1. Cantidad de información para un intervalo de lectura de 15 minutos 


Número de Datos Lecturas Intervalo de Cantidad de Datos 
Medidores Tiempo 
AM 





De los datos preliminares se puede apreciar que el crecimiento 
de la información es considerable, más aún si se requieren obtener 
reportes de esa cantidad de datos de manera eficiente para una 
posterior toma de decisiones. Es así que, lograr una infraestructura 
de medición avanzada, resulta importante investigar para lograr 
minimizar el impacto que esta red dispondría para una empresa de 
distribución eléctrica. 

Para crear una infraestructura de medición avanzada se han 
realizado varios aportes científicos que han buscado dar solución 
desde diferentes frentes y así conseguir una medición inteligente de 
energía eléctrica; sin embargo, las restricciones propias de la tecnolo- 
eía, las zonas, el costo, hacen de la planeación de la red de comuni- 
caciones un problema no trivial que en términos de optimización se 
describe como un problema NP-Complete dentro de los capítulos pro- 
pios de problemas combinatorios; por lo tanto, conseguir una única 
solución que nos entregue el óptimo global de la planeación de la red 
de comunicaciones resulta inviable; sin embargo, es posible advertir 
que las tecnologías se encuentran maduras y/o ya desplegadas con 
el objeto de minimizar el costo y garantizar la confiabilidad de la red 
[2], [5], [23]1-[25]. 

En sus inicios para conseguir una medición inteligente se avizo- 
raba un crecimiento oportuno para una solución con radio frecuencia 
ya sea en el rango de 902-928 MHz o en 169MHz, en este sentido, 
aunque no existía costo por uso de frecuencia sí se requería un núme- 
ro considerable de concentradores con REID; finalmente esta solución 
no dio eficiencia en el despliegue debido a que la configuración y 
mantenimiento de los recursos los debía absorber las empresas de 
distribución eléctrica destinadas tradicionalmente a un trabajo dife- 
rente por la naturaleza de su negocio. En un camino por solventar el 
problema de cobertura y permitir la bidireccionalidad de la red, se 
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realizaron enlaces de última milla colocando una tarjeta de comuni- 
cación con tecnología celular que permita el enlace con las estaciones 
base celular más cercanas. 

Posterior a los inicios de RFID orientado a disminuir las pérdi- 
das no técnicas de energía proveniente del robo o hurto de clientes 
residenciales, se advirtió una posibilidad para la medición inteligen- 
te de energía eléctrica de clientes industriales o especiales ubicados 
de manera aislada pero dentro de zonas con cobertura celular, dan- 
do origen a una solución única con tecnología celular, este costo por 
los recursos y el servicio del operador primario de telefonía celular 
al ser un escenario pequeño no presentaba dificultad y se generaron 
dichos despliegues con satisfacción compartida, tanto para el cliente 
industrial,como para la empresa de distribución que entrega el ser- 
vicio eléctrico. 

Actualmente, operadoras de telefonía celular han intentado 
dar servicio de medición inteligente incluyendo opciones para ener- 
ela eléctrica, agua y gas, basándose en que únicamente cambia el 
medidor inteligente y han realizado pruebas NB-loT que utilizan 
bandas celulares y que nació tradicionalmente como una tecnología 
de radio de banda estrecha para aplicaciones de internet de las cosas, 
por otro lado, se tiene el uso del ahora estándar IEEE 802.15.4g que 
tiene un costo menor a WiFi y aunque ha mejorado el alcance no ha 
llegado a destacar en aplicaciones de medición inteligente. 

Finalmente, y con mayor penetración en soluciones de medi- 
ción inteligente de energía eléctrica se encuentra WiFi utilizada en 
exteriores que puede lograr conectividad entre concentradores y 
medidores inteligentes; por lo tanto, puede convertirse en una fuer- 
te opción para lograr una planeación escalable de medición inteli- 
gentes de energía eléctrica, agua y gas. Para lograr que esta solución 
sea factible de implementar se debe tener en cuenta que al ser una 
solución híbrida se permite acoplar varias tecnologías, en este caso, 
de índole inalámbrico para formar una red heterogénea la misma 
que brinda la posibilidad de realizar multi saltos entre medidores 
inteligentes en zonas urbanas donde existen viviendas circundantes 
en un radio pequeño y en zonas suburbanas y rurales donde no exis- 
ta posibilidad de multi salto entre el hardware de comunicación de 
cada medidor inteligente [26],[27]-[31]. 
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B. Red de distribución eléctrica soterrada 


La necesidad de actualización de las redes eléctricas de dis- 
tribución debido a la creciente penetración de recursos energéticos 
distribuidos, junto con el crecimiento de la carga, eficiencia energé- 
tica, seguridad y calidad del suministro eléctrico han cambiado de 
forma significativa los enfoques tradicionales de planeación, diseño 
y operación del sistema de energía eléctrica [32]. Para superar los 
desafíos operacionales del sistema eléctrico de distribución se han 
empleado un gran número de algoritmos, siendo implementados en 
unas pocas redes específicas de prueba que aún no son capaces de 
proporcionar conclusiones sólidas y generalizadas [33],[34],[35]. 
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Figura 2. Planeación de redes eléctricas de distribución considerando 
arquitecturas soterradas y aéreas 


En el presente documento se analiza desde dos enfoques realis- 
tas que son propiedades intrínsecas en los sistemas eléctricos de distri- 
bución, los cuales son: propiedades topológicas y propiedades eléctri- 
cas. Ambas propiedades eléctricas y topológicas de redes eléctricas de 
distribución tienen un impacto significativo en el rendimiento global 
de la red incluyendo caídas de tensión, pérdidas de potencia, fiabili- 
dad de la red y, por último, cada impacto se ve reflejado en los costos. 
Por lo tanto, la presente investigación se centra en la planificación de 
redes eléctricas de distribución considerando restricciones reales con 
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la finalidad de proporcionar topologías seguras para la implementa- 
ción al menor costo como se ilustra en la Figura 2 y, por último, en 
un segundo escenario, mediante el software Cymdist, trabajar sobre 
la segunda propiedad de una red eléctrica de distribución. 

Con la finalidad de comprender y modelar una red compleja 
real soterrada y con la posibilidad de ser aérea o, en su defecto 
mixta, un conjunto de herramientas y técnicas son necesarias. En 
consecuencia, estas técnicas y herramientas tienen que ver con 
análisis de redes complejas y teoría de grafos. La red eléctrica sote- 
rrada dispone de varios elementos tales como líneas de transmisión, 
transformadores de distribución, pozos, zanjas y dispositivos de 
protecciones y maniobra eléctrica. Un modelo gráfico puede ser 
fácilmente construido teniendo en cuenta la relación de cada uno de 
los elementos existentes en la red eléctrica a desplegarse. 

Para poder construir redes eléctricas de distribución es de 
mucha importancia considerar definiciones que se utilizan en la 
investigación topológica, tales como: propiedades de un grafo, pro- 
piedad de profundidad y propiedad topológica en redes eléctricas de 
distribución considerando coordenadas georreferenciadas. 

Un grafo está formado por vértices (V) y aristas (E), donde, 
su expresión formal es G=(VE). En redes eléctricas de distribución, 
los vértices están asociados a los trasformadores de distribución, 
subestaciones, usuarios, interruptores, barras colectoras y pozos 
(redes soterradas) o postes (redes aéreas). La información de cada 
elemento, en relación con su posición, está dada en coordenadas 
geolocalizadas (Latitud y Longitud), donde, í representa el vértice 
de origen y j el vértice destino, que, mediante una arista E ambos 
vértices se relacionan. Al gráfico de conectividad se lo representa 
con una matriz de adyacencia cuadrada nxn, la misma que, rela- 
ciona a todos los vértices con sus respectivas aristas de manera 
controlada, es decir, sujeta a restricciones. Dichas restricciones en 
el presente documento son distancias lineales y capacidad de los 
trasformadores de distribución de albergar usuarios. Por lo tanto, 
la matriz cuadrada de conectividad es una matriz binaria, donde, 1 
representa la existencia de una arista de un nodo vi a un yv) y, por el 
contrario, O representa la no conectividad o la no existencia de una 
arista de un ví a un vj. En consecuencia, la matriz de conectividad se 
irá llenando de valores binarios coherentemente con las restriccio- 
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nes consideradas en el modelo para dar solución a la planeación de 
redes eléctricas de distribución. Por último, dentro de las propieda- 
des del grafo, se considera, la longitud de la red que está dada por 
las distancias acumuladas o parciales de las aristas, además se con- 
sidera la agrupación de los nodos que están directamente asociados 
con la capacidad del transformador de distribución. 

En la propiedad de profundidad se analiza la topología arma- 
da por el grafo no dirigido G desde la fuente hacia los usuarios fina- 
les, el mismo que, en redes eléctricas de distribución en los niveles 
de medio y bajo voltaje son radiales o tipo árbol [32]. Un grafo con 
topología tipo árbol está definido por la utilización mínima de aris- 
tas para la conexión de todos sus vértices, es decir, si es el número 
de nodos o usuarios un árbol relaciona a todos sus vértices con n-1 
aristas. En el presente documento se genera la ruta al mínimo cos- 
to utilizando el algoritmo de Dijkstra en la red de medio voltaje y 
mediante una breve modificación se genera el árbol de máximo cos- 
to para la red de bajo voltaje. En la red de bajo voltaje se maximiza, 
puesto que, es necesario satisfacer de cobertura a todos los usuarios 
relacionados con sus respectivos subconjuntos. 

En las propiedades topológicas de la red de distribución se 
observa la realidad del escenario, en el que, se contempla la canti- 
dad de nodos por km”, longitud de la red en medio voltaje requerido 
por km”, número de alimentadores y número de pozos en el caso de 
despliegues soterrados, son variables que, claramente caracterizan 
las diferencias topológicas entre tipos de redes aéreas o soterradas. 
Otro elemento determinante para la topología de la red eléctrica es 
la técnica aplicada de clusterización, la misma que, agrupa elementos 
de objetos similares. En la presente investigación empleamos para 
dicho cometido, una variante del algoritmo de PRIM, sin considerar, 
el conocimiento de la cantidad de agrupaciones existentes, es decir, el 
modelo determina el número óptimo de agrupaciones para garantizar 
el máximo número de usuarios cubiertos por la red eléctrica. 


3. Formulación del problema 


Esta sección está dividida en dos partes: a) describe las variables 
que describen el problema para la planeación de una red heterogénea 
inalámbrica dedicada a la medición inteligente de energía eléctrica y b) 
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las variables que se involucran para resolver el problema de ubicación 
de transformadores en una red de distribución eléctrica soterrada. 


A. Red heterogénea inalámbrica 


Si partimos de formalismos matemáticos, el problema de ubi- 
cación Óptima de PADs en una red de área vecindaria se la puede 
describir desde el concepto de teoría de grafos como un grafo no 
dirigido, el mismo que describe en un conjunto de vértices y como 
los enlaces, en este trabajo los medidores inteligentes se encuentran 
representados por los vértices y la red inalámbricas por los enlaces. 

El escenario propuesto plantea tres elementos o recursos, 
estaciones base celular, PADs y MIs; para ello, es necesario tener en 
cuenta que un MÍ puede enviar información a un PAD o a otro MI lo 
que permite que a través de multi salto se envíe información hasta 
un PAD. Existe conectividad entre PADs para lograr conectividad 
con la estación base celular más cercana que finalmente realizar el 
trabajo de última milla con la empresa de distribución eléctrica. 

Para el escenario propuesto los enlaces dentro del grafo no 
dirigido representan el costo determinado para este caso por la 
distancia, entonces se consideran únicamente valores positivos. Se 
supone que la tecnología inalámbrica a ser utilizada tanto en los MIs 
como en PAD es flexible, pero para el escenario se considera una red 
WiFi y celular. De esta manera el radio de transmisión puede ajus- 
tarse a las necesidades de la zona de despliegue, determinadas por 
las zonas urbanas, suburbanas o rurales; entonces, no todos los MIs 
tienen una única tecnología de comunicación. El alcance de comu- 
nicación de cada MI lo describe la variable ; además, definamos un 
conjunto U= (s1, s2, ... SN), de MIs. La posición del MI i-ésimo está 
dada por (xs, ys.), donde xsi,ysi E S.. El MI de coordenadas xsiysi 
puede conectarse a otro MÍ de coordenadas xsj, ysj s si la distancia es 
menor o igual a distancia permitida | (cs, ys, )- (xs. 9YS, )| <dmin. Por 
lo tanto, se tiene un subconjunto $, - (cui, yud), así [todo MI que ten- 
ga alcance en el rango de la tecnología inalámbrica propuesta está 
dada porS, . (xu,yu)= |(xs,ys, )-(xs, 9YS, ) | <dmin, V. ES 

En caso de que un MI no esté en el rango de conectividad de 
otro MI podrá conectarse a un PAD, para este caso se ha restringido 
la posibilidad que un MI pueda conectarse directamente a una esta- 
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ción base celular con el objeto de reducir los costos; sin embargo, un 
MI puede quedar sin conectividad ya sea por capacidad de MI más 
cercano o del PAD, pero de estar en el radio de alcance de una esta- 
ción base celular puede ser conectado por tecnología celular direc- 
tamente. Es importante recordar que un MI en su arquitectura tiene 
la flexibilidad de contar con un módulo de tecnología inalámbrica 
WiFi, IEEE 802.15.4g, Celular, etc. Así, tenemos un grafo que garan- 
tiza la conectividad de los tres recursos inicialmente expuestos. 

Para que un modelo de planeación sea considerado para uso 
real en las acciones de despliegue por parte de una empresa de dis- 
tribución eléctrica es necesario contar con coordenadas georreferen- 
ciadas de latitud y longitud; además, de un cálculo de la distancia 
con la fórmula de haversine que indica la ecuación 1, fórmula que 
considera la curvatura de la tierra. De esta manera xs,,ys, es la lon- 
gitud y latitud de los MIs 


Alat 
2 





) + cos(lat1)*cos(lat2)* sin” EN 


(1) 


Para aplicar la ecuación 1 se debe considerar a lat como la latitud 
y lon como la longitud; Alat es la diferencia de; lat2 - lat1; Alon = 
lon2 - lon1; R=6372.79547'7598 km que es el radio de la tierra. 


El trabajo propuesto para generar el modelo de planeación 
escalable no debe ser planteado como una simple partición del grafo 
inicialmente determinado por G=(VE) y subdividido en conjuntos o 
subredes más pequeñas a través de una clusterización en la que se 
puede configurar una capacidad para cada centroide que entregaría 
las coordenadas de un PAD y la razón se debe a que los métodos de 
clusterización nos entregan un resultado diferente y con subconjunto 
desbalanceados en lo que se refiere al número de MlIs por cada PAD. 

La variable es determinante para el proceso de enrutamiento; 
por tal razón, se requiere encontrar la distancia más corta no solo 
entre cada MÍ sino también con cada PAD ya que en el despliegue de 
una red heterogénea los multi saltos no deben ser muy largos para 
evitar retardos en el envío de paquetes o mayor consumo de energía. 

A continuación, se detalla el algoritmo utilizado en el modelo 
OPDWHN-AMI: 


Distancia = 2 * R * asin” sin? | 
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Algoritmo 1: OPDWHN-AMI 
Ns()) =0,Wj € [1,2,...Mj,Cov=0 
Conjunto Il de Internet 
Input: 
Conjunto U de DAPs, M =I| U Il 
Conjunto B de EB,K =I| B || 
Conjunto S de MIs,N =I| S || 
Parametro C,, capacidad de UDAPs 
Step 1: Construir matriz de costos G 
Step 2: for Uj,j € [1,...M) 
Y, = calculando árbol (Uj, S, Cm); 
Step 3: U, = SetCover(W,, Wa, ... Y y) 
Step 4: [nextsalto, cost] = dijkstra(G, II) 
Step 5:forSM E S 
nodo = SM 
while nodo E S 
nodo = nextsalto(nodo) 
end while 
Ns(nodo) = Ns(nodo) + 1 
if nodo € U 
Lov ++ 
end if 
end for 
Step 6:end for 
Step 7: retorna Cov/I| S || 
Step 8: retorna avg(Ns) 


La función Y implementada como un método recursivo de la 
heurística OPDWHN-AMI se presenta a continuación: 


Algoritmo 2: Y - Generación del árbol 


function Y = calcular árbol (Uj, S, Ci); 
Step 1: initializar Nsalto = 1, Y = (UJ)] 
nocon= S 
Ns(Uj)=0 
Step 2: while || Y I| < C,, 88: Nsaltos < Nsmax 
dmin = oo 
forie Y 
forj E nocon 
d = dist(i, j) 
if d < dmin 88: Ns(i) + 1 < Nsaltos 
a=i,b=j,dmin =d 
end if 
end for 
end for 
if dmin < inf 
Y= Y Uufb) 
nocon = noconX(b) 
Ns(b) = Ns(a) +1 
else 
Nsaltos = Nhop + 1 
end if 
end while 
Step 3: retorna Y 
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El modelo de planeación de redes heterogéneas inalámbricas bajo las 
consideraciones anteriormente descritas define un problema combi- 
natorio del tipo NP-Complete; por lo tanto, requiere un proceso heu- 
rístico para obtener un resultado cercano al óptimo que permita en la 
línea del tiempo seguir incluyendo nuevos Mls y PADs de ser el caso. 
Mediante la tabla 2 se hace un resumen de las variables 
empleadas en el modelo de redes inalámbricas heterogéneas. 


B. Red eléctrica soterrada 


El presente modelo para planeación de redes de distribución 
eléctrica soterrada considera similar principio al aplicado para medi- 
ción inteligente, con una variante en relación a la restricción para 
no permitir enlaces de cobertura radiales, sino que, permitir enlaces 
de cobertura lineales, evitando así, diagonales dentro del G=(VE) 
y, en consecuencia, se logra construir enlaces controlados sin cruces 
por los espacios delimitados por calles en todos sus lados, de esta 
manera, el despliegue de la red soterrada deberá seguir únicamen- 
te el camino preestablecido que refiere a calles y avenidas, en este 
caso, el problema advierte la necesidad ubicar de manera óptima el 
número de transformadores de distribución eléctrica; así como, el 
número de pozos de revisión que se requieran para el despliegue; 
para lo cual, se tomará información bajo normativas y estándares 
específicos para redes soterradas. 

Para resolver el problema combinatorio definido como NP-Com- 
plete, planteado en este trabajo, se incluye un modelo heurístico que 
permite encontrar el costo mínimo para lograr el máximo porcentaje 
de cobertura de servicio para los usuarios finales. A continuación, 
en la ecuación 2 se presenta el costo total de cada transformador 
perteneciente a cada clúster, donde, es el número de elementos de 
cada clúster y C, es la demanda individual de cada usuario depen- 
diendo de la demanda estratificada tipo al que pertenezca. En la 
ecuación 3, €, es el costo total de la subestación, donde, es el 
número de clústeres existentes en el escenario. Un aspecto de mucha 
importancia es que, en cada iteración para obtener el costo de la 
subestación, se obtiene el costo acumulado por el algoritmo en cada 
transformador de distribución a desplegarse en el área de interés. 
De aquí en adelante, entiéndase por costo a los valores en MVAs o 
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KVAs AOL subestaciones) y longitudes (conductores), 
según 
ME z C,(k1), Vze,C, € R*>0; 2) 


ze 


Coup = => ) Ci (k1,p), Vze,le € R* >0; (3) 


k1=1 p= 


En la ecuación 4, el costo total del conductor en la red de medio 
voltaje está representado por Cmv.., la expresión d, es la longitud 
del tramo de un punto í a un punto j, el factor de multiplicación k 
es una variable de costo por cada metro para la implementación de 
la red de medio voltaje y, por último, N es la longitud del vector que 
contiene las posiciones de los transformadores incluyendo la posi- 
ción de la subestación. Por otro lado, la expresión N-1 representa el 
número de aristas mínimo para garantizar de conectividad a todos 
los transformadores desde la subestación. 


Mcon = ) dark, VNER* > 1; (4) 


En la ecuación 5, se presenta el costo total del conductor de 
la red de bajo voltaje multiplicado por el factor K explicado ante- 
riormente. La expresión d,,,, representa las distancias máximas 
requeridas en cada tramo para garantizar la conectividad desde la 
fuente hacia los nodos de servicio, la misma que, representa a la 
distancia más crítica, es decir, existirá distancias menores dentro de 
cada de: pero no mayores. 


zise(ze)-1 


Ucon -> max 2, Cn, a) > Ros ANS R*; (5) 


En consecuencia, el problema de optimización, para planea- 
ción de redes eléctricas de distribución, se define de la siguiente 
manera mediante la ecuación 6: 


min Cr Pla + LM TL (6) 


Sujeto a: 
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La ecuación 7, se expresa la restricción de capacidad, con lo 
cual, se limita el número de usuarios asociados a un transformador 
de distribución, donde, t es la cantidad de elementos intra-clúster 
máximo permitido, A(6) es el conjunto de usuarios emplazados en el 
área de interés y d son los subconjuntos de agrupaciones. La ecua- 
ción 8, es una rutina de comprobación, en la cual, se verifica que 
la suma de los nodos de cada agrupación sea igual a la longitud de 
B de usuarios desplegados en el área. De esta manera, se garantiza 
que los subconjuntos creados cubran el 100% de los usuarios empla- 
zados en el área de estudio. Con la ecuación 9 se garantiza que, en 
cada agrupación, únicamente existan elementos que cumplan con la 
restricción de distancia máxima permitida para asociar a un usuario 
a un transformador de distribución. 


Tabla 2. Variables usadas para modelo OPDWHN-AMI 


Símbolo Descripción Significado 
I Internet Conjunto internet 
B Estación base cellular Conjunto EB 
U Conjunto PADs 
S Medidores Inteligentes Conjunto de MIs 
Ca Capacidad Capacidad PAD 
G Matriz de conectividad Matriz de costo 
dist distancia Distancia haversine entre 
recursos 
Cov Cobertura Cobertura de MIs 
y Arbl Steiner tree 
U,, Set cover Set cover/ radio de cobertura 
Ns MIS conectados Promedio de MlIs conectados 
Y; Conjunto de MIs —>PAD Direct | multi saltos 
nocon No conectado MIS no conectados 
Nsaltos ff saltos Saltos 
Nsmax Max + de saltos Max + Saltos 
dmin Min distancia Distancia mínima 
a, b Variable i, j Variable temporal 
Uj subconjunto Subconjunto de U 
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En la tabla 3 se presenta un resumen de las variables emplea- 
das en el modelo de planeación de redes eléctricas de distribución. 


Símbolo 


Cer 


Cl 
CMVeon 


505: 20 
d 


dmax 


Ze 
CE 


le 
da 


Ps 


T 
Bb; Bb; 
A(B) 


Descripción 


Costo 


Costo 
Costo 


Costo 
distancia 


Distancia 
Variable 


Demanda en kVA 


Variable 


Distancia 


Variable 


Variable costo 


Subconjuntos 
Elementos de un clúster 


Coordenadas 
Conjunto 
Variable 


variable 


conjunto 


Tabla 3. Variables usadas en modelo DORED 


Significado 


Costo de transformador de 
distribución 

Costo total de la subestación 
Costo total del conductor MV 


Costo total del conductor de la 
red de bajo voltaje 

Distancias máximas 
requeridas en cada tramo 
Distancia máxima permitida 


Número de elementos de cada 
clúster 

Demanda individual según su 
estrato 

Número de clústeres 


Longitud de un tramo de un 
punto í a un punto j 

Contiene el valor de la 
longitud de del vector de 
Usuarios y transformadores 
Costo por cada metro 
instalado en red MV 
Subconjuntos de agrupaciones 


Max + permitido en un clúster 


Coordenadas en latitud y 
longitud de usuarios 
Usuarios emplazados en área 
georreferenciada 

Número de elementos a 
desplegarse 

Longitud de la zanja 


Número de pozos a 
desplegarse 


En la Figura 3 se presenta el flujograma del algoritmo Despliegue 
Óptimo de Redes Eléctricas de Distribución (DORED), el cual, contiene 
la metodología del modelo propuesto en el presente documento. Se 
parte del análisis y extracción de los datos georreferenciados obteni- 
dos de la plataforma virtual gratuita OpenStreetMap. Posteriormente, 
mediante el software Matlab, se procede a preparar el conjunto de 
datos a ser utilizados, es decir, no toda la información es válida, puesto 
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que, en un archivo osm existen miles de coordenadas georreferencia- 
das (Latitud y longitud), de tal manera que, si no se hace una limpieza 
de datos, estos hacen que, el cpu-time que el ordenador emplee para 
encontrar la solución, aumente de manera significativa arrojando resul- 
tados poco confiables. Por lo tanto, es de mucha importancia ordenar 
la información y desechar datos que se encuentran fuera del área de 
interés para el despliegue óptimo de redes eléctricas de distribución. 

Una vez que la información se encuentra clasificada se definen 
las variables a ser empleadas en el modelo. Estas variables son: coor- 
denadas de viviendas, ubicación de subestaciones, sitios candidatos 
para emplazar los transformadores de distribución y datos de las 
vías disponibles para la construcción del mínimo árbol de expansión 
de la zanja, logrando generar con ello, la topología necesaria reque- 
rida en los primarios de los transformadores. En consecuencia, una 
vez definida las variables a emplear en el modelo, se genera una 
matriz de distancias de dimensión nxn (matriz cuadrada) que arma 
un mesh relacionando a todos los nodos entre sí. Para el cálculo de 
las distancias se emplea la ecuación de haversine, anteriormente 
mencionada, en la ecuación 1. 

Una vez que se conoce la matriz de distancias se procede a 
generar varios escenarios posibles, es decir, se generan subconjuntos 
de soluciones previas. Además, estas soluciones previas se apoyan 
en técnicas de clusterización, específicamente en una variante del 
algoritmo de PRIM, el cual, construye árboles de mínima expansión. 
El aporte en la variante del algoritmo de PRIM, antes mencionada, 
radica en la integración de rutinas de verificación, el cual, permite 
ingresar restricciones de capacidad y rangos máximos permitidos de 
cobertura. Por lo tanto, mediante la variante de PRIM el modelo es 
capaz de agrupar nodos (usuarios finales, transformadores, subesta- 
ciones, sitios candidatos., etc.) y generar escenarios previos. El núme- 
ro de escenarios previos generados dependerá el número de sitios 
candidatos para emplazar transformadores de distribución, estos 
sitios candidatos son los pozos distribuidos a lo largo de la zanja, por 
la cual, pasará la red de medio voltaje. 
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Figura 3. Flujograma del algoritmo dimensionamiento óptimo de redes 
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Un detalle de mucho interés, es que, la zanja podrá ser usada 
para el despliegue de fibra óptica. La distribución de los pozos se da a 
40 metros y su emplazamiento se origina desde la subestación hacia 
toda la ruta que sigue la zanja en el caso de redes eléctricas soterra- 
das. A manera de ilustración, si la zanja dispone de 5 km lineales 
desde la subestación hacia todos sus ramales el número de pozos 
requerido mínimo en el despliegue será de 125 excavaciones. Por lo 
tanto, los escenarios estarán representados por una matriz de mnx 
elementos, es decir, sus filas y columnas son de diferente longitud, 
donde, n representa a la cantidad de pozos y m el número de usuarios 
finales emplazados en el área de interés. 

Una vez identificados los diferentes escenarios previos genera- 
dos, se procede a ingresar dicha matriz al algoritmo de setcover, el 
cual, minimiza el número de escenarios generados garantizando la 
máxima cobertura a los usuarios finales. Es decir, se toman los sub- 
conjuntos que contengan el mayor número de nodos cubiertos hasta 
que todos los usuarios desplegados en el escenario queden asociados 
a algún subconjunto. En este punto se genera un inconveniente, 
recordemos que los escenarios son generados mediante una técnica 
de clusterización observando los mismos criterios de capacidad y 
cobertura en cada nueva iteración, lo que hace que, existan subcon- 
juntos seleccionados como solución por el algoritmo del setcover que 
contengan los mismos elementos que otros subconjuntos, es decir, en 
la solución del algoritmo del setcover tendremos subconjuntos con 
elementos redundantes, lo que, en redes de distribución desemboca 
en la posibilidad de que un usuario pueda estar cubierto por más de 
1 transformador de distribución, lo cual, en la práctica no es correcto. 

Por lo tanto, una vez identificado los conjuntos se procede a 
eliminar los elementos redundantes siguiendo la metodología como 
se detalla a continuación; se ordenan los subconjuntos de mayor a 
menor y en cada iteración verificamos que el subconjunto siguiente 
no contengan los elementos del subconjunto predecesor de la matriz 
solución obtenida por el algoritmo Setcover. Este mismo criterio se 
aplica hasta hacer un barrido en toda la matriz, logrando con ello, 
eliminar los elementos redundantes garantizando que la capacidad de 
albergar usuarios sea la máxima posible en cada subconjunto. 
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Por lo tanto, como resultado tendremos el mínimo número 
de subconjuntos con la máxima cobertura posible a cada usuario 
final. Si un usuario se queda sin conexión a algún secundario de los 
transformadores a emplazarse, el diseñador conocerá toda la infor- 
mación necesaria, de tal manera que, pueda tomar decisiones ade- 
cuadas para otorgarle conectividad a algún secundario de los trans- 
formadores de distribución distribuidos en el área de interés. Una 
vez identificados los subconjuntos, con sus elementos redundantes 
eliminados, se procede a emplazar los transformadores de distribu- 
ción. En consecuencia, el número de transformadores requeridos en 
el despliegue corresponde a la cantidad de subconjuntos resultantes 
del algoritmo del setcover. 

Dicho de otra manera, tomando el mismo ejemplo anterior, en 
el que, se necesitaba 125 pozos para una longitud de 5 km de zanja, 
el algoritmo setcover arrojará como resultados posiblemente 80, 75, 
50 (subconjuntos) unidades de transformadores requeridos en el 
escenario, esta variación dependerá exclusivamente de las restric- 
ciones de capacidad y cobertura ingresadas como restricciones en la 
generación inicial de los subconjuntos previos, antes de pasar por el 
algoritmo del setcover. 

En consecuencia, si aumentamos la capacidad de agrupar 
elementos disminuiremos la cantidad de transformadores de distri- 
bución requeridos, pero, indudablemente aumentará la capacidad 
en kVAs requerida a instalar en dicho punto, caso contrario si, dismi- 
nuimos la capacidad de agrupar aumenta el número de transforma- 
dores necesarios en el despliegue y disminuye la capacidad en kVAs 
de los transformadores necesarios en el despliegue. 

Por lo tanto, se logra optimizar el número de transformadores 
mediante una técnica de clusterización, con la cual, se genera esce- 
narios y posteriormente, mediante el algoritmo del setcover reduci- 
mos al máximo los subconjuntos necesarios para garantizar la máxi- 
ma cobertura a los usuarios finales y, posteriormente se procede a 
ubicar los transformadores, en cada subconjunto, aproximadamente 
en el centro de masa, con la finalidad de garantizar distancias simi- 
lares desde el transformador hacia sus puntos de carga más alejados. 

En este punto, el que se ha logrado tener un conocimiento 
sobre de la distribución de los elementos de potencia en redes eléc- 
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tricas de distribución, se procede a generar árboles de mínima y 
máxima expansión a dos capas. Una capa en medio voltaje (mínima 
expansión) y la otra capa en bajo voltaje (máxima expansión), de tal 
manera que, la red de distribución óptima queda identificada. Por lo 
tanto, hasta este punto se logra proporcionar mediante el software 
Matlab y con la base de datos de OpenStreetMap un mapa de ruta, 
donde, mediante restricciones, tales como capacidad y cobertura, se 
garantiza que su costo sea el mínimo. 

Una vez que se conoce la topología de la red eléctrica de distribu- 
ción y cada uno de sus subconjuntos se procede a verificar el comporta- 
miento de la caída de tensión desde el transformador hacia los nodos de 
carga más lejanos en cada subconjunto. Para ello, se ha otorgado cargas 
randómicas normalizadas a cada usuario. Estas cargas proporcionadas 
aleatoriamente corresponden a valores tipo considerando la introduc- 
ción de cocinas de inducción y calentamiento de agua. Además, se ha 
dividido el área en sectores, es decir, se proporcionará valores randó- 
micos de cargas tipo identificando los estratos a los que pertenece cada 
usuario, los valores de consumo en kVAs de cada estrato, se tomó de la 
Guía de diseño de la EEO. Por lo tanto, el modelo es capaz de hacer el 
análisis de caídas de tensión desde los secundarios del transformador 
hacia sus puntos de carga más alejados y, a su vez, puede determinar la 
capacidad del transformador con valores ya estandarizados. El modelo 
nos permitirá ver y analizar el comportamiento, si los usuarios aumen- 
tan su demanda, ayudando con eso a planear posibles expansiones por 
incremento de energía demandada, que con el pasar del tiempo, su 
tendencia está en aumento. Finalmente, el modelo entrega un reporte 
ejecutivo de los elementos requeridos para la construcción de la red 
eléctrica de distribución. 


4. Análisis de resultados 


A. Red heterogénea inalámbrica para medición inteligente 


en esta sección, se demuestra como el modelo de planeación 
de una red heterogénea inalámbrica que despliega PADs y los MIs 
que finalmente se articular hasta lograr la conectividad con una 
estación base celular. Se evalúan parámetros que dan cuenta del 
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rendimiento en términos de minimización de los recursos. La Figura 
4 muestra el despliegue de los PADs candidatos, los mismos que se 
ubican en las intersecciones de calles y avenidas, lugar donde se 
ubican postes de alumbrado público y donde finalmente se podrán 
instalar los PADs requeridos para dar cobertura a los MIs de cada 
una de las viviendas, considerando la capacidad de los PADs en fun- 
ción de la tecnología inalámbrica en cada MI o PAD. 

El escenario advierte un número inicial de PADs con =57, un 
número de MIs =349 y estación base celular =1. El escenario se ha 
dividido por un proceso de teselación con Delaunay y Voronoi para 
segmentar las áreas que pueden determinar los estratos o grupo de 
viviendas, según detalla la Figura 5 
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Figura 4. Escenario de planeación de una red heterogénea inalámbrica 


Además, la Figura 5 indica la reducción del número M de 
PADs que se requieren para cubrir un número N de MlIs; se aprecia 
también el proceso de teselación realizada con Delaunay y Voronoi 
para dividir en 3 áreas o estratos que dividen los diferentes tipos de 
clientes que puede segmentar una empresa de distribución eléctrica; 
en este caso, cada estrato toma un color diferente. 
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Figura 5. Optimización de recursos — minimización de PADs 


La Figura 6 representa la malla factible lograda para el esce- 
nario propuesto con una dmin=49mts; de esta manera, se consigue 
la conectividad del grafo G=(VE). Con esta visión previa de los 
posibles enlaces inalámbricos se procede a buscar el mínimo árbol 
de expansión que se podría lograr. 
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Figura 6. Malla factible de conexiones posibles con restricción de distancia 
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La Figura 7 muestra la reordenación inversa Cuthill-McKee 
para mover todos los elementos distintos de cero más cerca de la 
diagonal, reduciendo el “ancho de banda” de la matriz original G. 

La Figura 8 muestra el mínimo árbol de expansión, luego de 
haber resuelto el problema del setcover que logra la mayor cobertu- 
ra; es decir, maximiza la cobertura de todos los Mis con la mínima 
solución encontrada al generar el mínimo árbol de expansión a tra- 
vés del algoritmo Y para generación del árbol. 
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Figura 7. Reordenación inversa Cuthill-McKee 


La Figura 9 representa los subconjuntos obtenidos al haber 
incluido tres tipos de tecnologías inalámbricas y en conjunto se 
puede visualizar los recursos que son agrupados y que a través de 
un PAD finalmente llegan hasta una estación base celular, la repre- 
sentación de este proceso se encuentra en color celeste. Los enlaces 
de tecnología inalámbrica WiFi se encuentran en color rosado; los 
enlaces entre PAD en color verde, para este caso la tecnología ina- 
lámbrica puede ser WiFi o Celular dependiente de las características 
de la zona y los recursos existentes en términos de cobertura celular. 
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B. Red de Distribución Eléctrica Soterrada 


En la Figura 10 se presenta la disposición del escenario, el cual, 
se empleará para desplegar transformadores eléctricos de distribución. 
El escenario propuesto dispone de 3 estratos, ilustrados en la Figura 
10 mediante tres colores diferentes. El criterio de estratificación se lo 
llevó a cabo mediante el algoritmo de K-medoids tomando en con- 
sideración la guía de diseño de redes de distribución de la Empresa 
Eléctrica Quito (EEQ) para otorgar demandas máximas tipo por cada 
usuario. Los estratos empleados en el presente documento son: E, D, 
C y B. Es de mucha importancia mencionar que, el modelo, permite 
modificar dichos parámetros para poder ajustarse a diferentes realida- 
des o disposiciones topográficas. A cada usuario de cada estrato se le 
otorgó un consu 
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Figura 10. Escenario inicial considerando estratificación 


En la tabla 4 se ilustra un cuadro resumen de los resultados 
obtenidos del despliegue óptimo de transformadores para satisfacer 
de servicio eléctrico a los abonados al sistema de distribución, consi- 
derando, diferentes escenarios. La heurística propuesta, para resolver 
el problema combinatorio de ubicación de transformadores observan- 
do restricciones de capacidad y cobertura, se valida mediante la tabla 
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4, donde, se puede observar los diferentes escenarios resueltos por el 
modelo. Se puede apreciar además que, a medida que, la capacidad 
aumenta los parámetros de las columnas 2, 4 y 5 también lo hacen. 
En el caso de la columna 2 de la tabla 4 se desvela que, al incrementar 
la capacidad la variación de la cobertura no sigue ningún patrón, es 
decir, no es ni directamente proporcional ni inversamente proporcio- 
nal a la capacidad, por lo tanto, el porcentaje de cobertura no depen- 
de de la capacidad de agrupamiento del transformador, sino que, 
depende de la disposición geográfica de los usuarios finales, puesto 
que, la ubicación involucra directamente a la variable distancia, que 
es, una restricción tonada en cuenta en el presente modelo. 


Tabla 4. Planeación y despliegues obtenidos variando capacidad de 
agrupamiento de cada transformador 


Capacidad Transformadores 
Máxima 
(unidades) 


Cobertura Cap. Subestación kVA-m 


Requeridos A 
10) 
EN) (MIVAS) (KVA/cantidad) E 


100/9 
75/6 
60/1 
45/2 
30/2 
15/7 

112,572 
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i Transf 
roda Cobertura Cap. Subestación INEA PIO COÍN kVA-m 


(%) (MVAs) 


Máxima Requeridos 
kVA/cantidad 
100/10 815.57 
112: 641.61 
12512 653.40 
60/ 1 248.59 
73 Z 1052.02 

45/ 1 347.48 


15/6 225.66 


máximo 


ASIS 1020.00 
12572 555.68 
150/3 674.59 
100/3 1114.74 
75/1 489.63 
45/2 244.13 
50/1 186.96 
15/6 219/51 


150/5 1219.87 
160/2 747.23 
112543 679.50 
12512 726,31 
75/1 109.79 
100/1 467.79 
60/1 LOL 
15/6 2391.20 


160/2 
200/3 
150/5 
¡Al 
15/6 


1190.86 
1026.78 
178.27 
480.89 
2222 
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En la columna 3, de la tabla 4, se presenta la capacidad cal- 
culada por el algoritmo de la subestación requerida en MVAs. En 
párrafos anteriores se ha explicado que, a cada usuario, se otorgó 
un consumo máximo tipo randómico, lo que hace que, en cada 
iteración la heurística obtenga diferentes resultados muy próximos 
entre sí. Dichos resultados son controlados, es decir, se otorga por 
cada estrado un nivel mínimo y máximo de consumo randómico a 
cada usuario. Por lo tanto, la heurística propuesta no coloca cargas 
rígidas o únicas a los usuarios finales y además permite identificar, 
por la posición geográfica, el estrato al que pertenece cada abonado 
a la red eléctrica de distribución. En consecuencia, la capacidad de 
la subestación no depende de la capacidad en MVAs estandarizado 
de cada transformador, sino que, depende de la carga total instalada 
y del número y tipo de usuarios. Por lo tanto, el valor obtenido de 
la tabla 4 en la columna 3, debe ser estandarizado de acuerdo a la 
disposición del mercado en MVAs de subestaciones de distribución. 

En la columna 4 de la tabla 4 se aprecia que, a medida que 
la capacidad aumenta, disminuye la cantidad de transformadores y 
aumenta la necesidad de incrementar la capacidad en MVAs requerida 
para satisfacer de servicio a usuarios finales asociados a la red eléc- 
trica de distribución. Por lo tanto, queda demostrada la funcionalidad 
y validez de la heurística propuesta. En la columna 5 se presenta la 
métrica en kVA-m máximo desde un transformador hasta su punto 
más lejano, es decir, se presenta el peor de los casos. Mediante la 
métrica, expuesta anteriormente, se puede dimensionar el calibre del 
conductor a emplearse, considerando la caída de voltaje en los extre- 
mos más alejados desde la fuente (transformador de servicio), en bajo 
voltaje, mediante la relación kVAs-m calculados/kVAs-m soportados. 
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Figura 11. Planeación óptima de una red de distribución soterrada de 
energía eléctrica considerando capacidad y cobertura 


En la Figura 11 se presenta el resultado de la planeación obte- 
nida por la heurística propuesta en el presente documento. Median- 
te la figura, anteriormente mencionada, se puede apreciar el mapa 
de ruta a emplearse garantizando el mínimo costo. El escenario de 
la Figura 11. dispone de N=349 usuarios distribuidos geográfica- 
mente y corresponde a los resultados obtenidos en la tabla 4 con 
capacidad máxima de albergar a 18 usuarios. Además, la heurística 
planteada proporciona datos de variables que son determinantes en 
el momento de elegir sobre la solución a ejecutarse en el proceso de 
planeación, tales como: número de pozos requerido (115), longitud 
de canalización o zanja (4.614 km) y demanda total máxima de 
cada estrato: 1 (431.44 kVA), 2 (371.22 kVA) y 3 (626.04 kVAs). En 
consecuencia, el modelo propuesto es capaz de modelar de manera 
dinámica el despliegue de transformadores eléctricos dentro de un 
área georreferenciada proporcionándonos parámetros valiosos de 
diseño con los cuales, el ingeniero eléctrico, puede tomar decisiones 
observando parámetros técnicos. Por lo tanto, en el presente docu- 
mento se desvela una herramienta muy prometedora de diseño en 
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redes eléctricas de distribución soterrada que ayude al diseñador a 
tomar decisiones, no solo más certeras, sino que, garantice la conti- 
nuidad y calidad del servicio eléctrico a los usuarios finales pertene- 
cientes a la red eléctrica de distribución. 
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Figura 12. Máximas caídas de voltaje en la red secundaria en diferentes 
escenarios considerando capacidad y rangos de cobertura 


En la Figura 12 se aprecia el comportamiento del voltaje en 
función de la distancia en la red de medio voltaje. Es evidente que 
la variación de voltaje, expresada en porcentaje, aumenta a medida 
que la distancia también lo hace, esto se debe a que, a mayor lon- 
gitud del conductor existe mayores pérdidas por efecto Joule. Los 
datos de la Figura 12, en el escenario ensayado, están distribuidos 
de manera dispersa, puesto que, como se explicó en párrafos ante- 
riores, los datos obtenidos no siguen ningún patrón a medida que 
incrementa la capacidad, sino que, depende del escenario, la capaci- 
dad de agrupamiento observando las restricciones propias del mode- 
lo propuesto y la capacidad de conducción del conductor a emplear. 
Además, la variación de voltaje no solo depende de la distancia, 
sino que, también depende de las distancias acumuladas a lo largo 
del tramo hasta llegar al usuario más alejado del circuito, del lado 
secundario del transformador al que pertenece. En consecuencia, se 


Óptima planeación de recursos para redes eléctricas inteligentes usando modelos heurísticos 


puede apreciar que a medida que se aumenta la capacidad los por- 
centajes de variación de voltaje también lo hacen y esto sucede, ya 
que, al aumentar la capacidad de albergar usuarios por un transfor- 
mador de manera conjunta aumenta las distancias desde un trans- 
formador hacia su nodo más lejano de servicio. Por último, mediante 
la Figura 12, se aprecia que, a cada transformador en sus diferentes 
escenarios con sus respectivas variaciones de voltaje generales, de 
lo que, se puede inferir que ningún transformador supera los límites 
máximos de caídas de voltaje desde la fuente hacia el usuario más 
alejado del transformador en cada escenario propuesto. 

En la Figura 13 se ilustra el modelado de la subestación emplea- 
da en el proceso de simulación de la red eléctrica en los primarios de 
los transformadores otorgándole criterios de confiabilidad, lo cual, 
naturalmente eleva los costos de implementación. En el modelado del 
mapa de ruta obtenido por la heurística mediante el software MATLAB, 
se ha extraído la información necesaria como: cargas concentradas 
en cada transformador, número y capacidades requeridas en MVAs 
de los transformadores para satisfacer a la demanda en cada tramo, 
dimensionamiento de la subestación requerida, número de alimenta- 
dores y longitudes en cada tramo, ya sea, en medio y bajo voltaje. En 
consecuencia, una vez obtenidos las variables necesarias para el diseño 
de despliegue óptimo de transformadores considerando las demandas 
totales tipo por cada abonado, mediante el software Cymdist se proce- 
de a simular un flujo de potencia. Mediante la simulación del flujo de 
potencia podemos verificar el estado de la red eléctrica en medio volta- 
je con las condiciones proporcionadas en el mapa de ruta obtenido de 
la heurística propuesta. Por lo tanto, en la Figura 13. se verifica, además 
de la configuración de la subestación, el flujo de potencia, logrando 
con ello, obtener los datos de las variables de voltajes en p.u. con sus 
respectivos ángulos, corrientes en los conductores, potencia activa y 
potencia reactiva, con lo que, se puede ejecutar procesos de planeación 
en redes eléctricas de distribución. Es muy importante mencionar que, 
los valores en p.u. son adimensionales y pueden representar a cualquier 
magnitud física, ya sea, voltaje, corriente, impedancias etc., en conse- 
cuencia, cada valor en p.u. adimensional depende de su valor base real 
de cualquier parámetro eléctrico al que nos refiramos, para convertir 
un valor en p.u., en valores reales. 
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Figura 14. Diagrama unifilar trifásico en media tensión 
mediante software cymdist 
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Mediante la tabla 4 y la Figura 13. se valida el funcionamien- 
to de la heurística propuesta en el presente trabajo, puesto que, 
mediante el triángulo de potencias, con los datos de la Figura 13, 
nos permite encontrar, en MVAs, la capacidad de la subestación 
requerida para satisfacer la demanda bajo las consideraciones des- 
critas anteriormente. En consecuencia, con los datos de potencia 
activa y reactiva obtenidos de la simulación en el software Cymdist, 
calculamos el valor de la potencia aparente, cuyo valor es 1.41 
MVAs, mientras que, si nos percatamos en la tabla 4 en la fila con 
capacidad de 18 usuarios, la capacidad calculada por el modelo en 
MVAs es de 1.42. Por lo tanto, los valores obtenidos en el software 
Cymdist y los calculados mediante el modelo propuesto en el sof- 
tware MATLAB son semejantes, de tal manera que, se logra demos- 
trar y validar la funcionalidad del modelo propuesto garantizando 
altos niveles de confiabilidad en los resultados obtenidos. 

En la Figura 14 se muestra el diagrama unifilar obtenido en la 
simulación del flujo de potencia mediante el software Cymdist. En 
consecuencia, el mapa de ruta georreferenciado obtenido del software 
Matlab es posible simular, dicho mapa de ruta, en el software Cymdist 
con la finalidad de verificar el comportamiento de la red eléctrica en 
régimen permanente. Por lo tanto, una vez obtenido el mapa de ruta, 
mediante el software Cymdist, se puede realizar todo tipo de análi- 
sis pertinente en un proceso de planeación de redes de distribución, 
ya sea, soterrado, aéreo o mixto. Por lo tanto, la importancia de la 
propuesta planteada como una solución para despliegue de redes 
de distribución del presente documento, radica en que, mediante la 
observación de restricciones emplace los transformadores de potencia 
en los sitios idóneos garantizando minimizar costos maximizando la 
calidad y seguridad energética proporcionada a los usuarios finales. 
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Figura 15. Perfil de voltaje y corriente circulantes en cada 
tramo desde la fuente 


En las métricas de la Figura 15 se puede apreciar el comporta- 
miento del voltaje y la corriente en función de la distancia. La lon- 
gitud máxima desde la fuente hacia el transformador más alejado es 
aproximadamente 580 m. En la Figura 15A se expresa que a medida 
que un transformador se aleja de la fuente existe caídas de voltaje 
en cada tramo, además, las caídas de voltaje en cada son similares, 
lo que pone de manifiesto que, para la presente explicación se ha 
modelado un sistema trifásico con cargas repartidas equilibradas 
en cada fase. Por otro lado, la Figura 15B nos muestra las máxi- 
mas corrientes soportadas en la fuente y a medida que la distancia 
aumenta esas corrientes van disminuyendo, esto sucede ya que, en 
la fuente se refleja el consumo total de la zona a la que, dicha fuente, 
sirve. Por lo tanto, a medida que la distancia de servicio aumenta la 
corriente disminuye, ya que, la corriente nominal desde la fuente, en 
cada nodo primario, dependiendo de la topología se va dividiendo. 
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En la Figura 16 A y B sucede algo similar que lo explicado 
en el párrafo anterior. En consecuencia, a medida que la distancia 
aumenta, tanto la potencia aparente como la potencia reactiva, 
disminuyen. Estas métricas nos permiten observar el estado de la 
red eléctrica de distribución y planificar la colocación de bancos de 


condensadores en caso de ser necesario. 
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Figura 16. Perfiles de potencia aparente y reactiva desde la fuente en 
función de la distancia 


En la Figura 17 se ilustra el diagrama unifilar al aplicar, 
mediante el software Cymdist, el módulo de análisis de fallas “Hue- 
cos de Tensión”. Cada color representa la magnitud en p.u del hueco 
de tensión en cada tramo. En consecuencia, el color rojo simboliza 
mayor que O y menor que 0.1, el color naranja mayor que 0.2 y 
menor que 0.3, el color verde mayor que 0.5 y menor que 0.6 y por 
último el color azul mayor que 0.9 y menor que 1. 
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Figura 17. Análisis de huecos de tensión en la red de media tensión 
mediante software cymdist 


Sabemos que, los huecos de tensión son perturbaciones en los 
sistemas eléctricos que afecta a la calidad del suministro de energía 
eléctrica. En consecuencia, el análisis de los huecos de tensión se 
produce en forma repentina en un punto particular de la red, para 
el caso, se ha hecho el análisis de hueco de tensión en el Nodo 11 
(Ver Figura 13). Por lo tanto, los huecos de tensión se producen por 
la reducción súbita de la tensión recuperando sus valores habituales 
en un intervalo corto de tiempo y la causa habitual para que esto 
suceda son los cortocircuitos. 

Por lo tanto, los huecos de tensión pueden influir en la impe- 
dancia y localización de falla, la forma de actuación de las proteccio- 
nes, la conexión de la carga y el tipo de fallo. Además, provoca fallos 
en los equipos conectados a la red eléctrica, puesto que, existen 
dispositivos que necesitan cierta calidad de alimentación y pueden 
verse perjudicados en su rendimiento. 
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Figura 18. Suma de las frecuencias y su tensión de hueco 


Como se ha explicado en párrafos anteriores un hueco de ten- 
sión está relacionado con la reducción del valor rms por un periodo 
corto de duración. Los valores relacionados en p.u. de la reducción 
de la componente fundamental de tensión son de 0.1 a 0.9, con 
duración mayor que medio ciclo y menor de 1 minuto. 

En la Figura 18 se ilustra en el eje de las ordenadas la suma de 
huecos de tensión esperados por año y en el eje de las abscisas las 
magnitudes de los diferentes huecos de tensión. En consecuencia, el 
cúmulo de frecuencia de huecos de tensión da cuenta, de cuántos 
huecos de tensión de valores remanentes menores o iguales a cierto 
umbral ocurrieron en un periodo de tiempo. 

Es necesario mencionar que, el cúmulo de frecuencia al estar 
relacionado al número de fallas durante un año (tasa de falla) Cym- 
dist modela este fenómeno en la red de distribución eléctrica con el 
ingreso de datos de las tasas de falla tanto de las barras como por- 
ciones de las líneas, cada posición de falla puede tener una tasa de 
falla diferente, la misma que, se puede relacionar directamente con 
el tipo de instalación. Las tasas de fallas son también diferenciadas 
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en los tipos de falla de podrían producirse en los sistemas eléctricos 
de potencia, trifásico, monofásico, bifásico y bifásico a tierra. 
1.4 5 
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Figura 19. Número de fallas por año con respecto a la magnitud del hueco 


De manera similar, en la Figura 19. se ilustra el número de 
fallas ocurridas al año con respecto a la magnitud del hueco de 
tensión. Es de mucha importancia citar que, el análisis de huecos de 
tensión simulado mediante el software Cymdist se aplicó en el Nodo 
11, mismo que, se ilustra en la Figura 13. 

Por lo tanto, queda demostrado que en el presente documento 
se logra, mediante el software Matlab, implementar una heurística 
capaz de dar solución óptima al problema de planeación de redes 
de distribución considerando restricciones de capacidad y cober- 
tura otorgando confiabilidad a la solución obtenida, puesto que, 
se ha validado dicha solución mediante el software Cymdist. En 
consecuencia, la heurística propuesta es una herramienta de mucha 
utilidad para proporcionar soluciones optimas de planeamiento, uti- 
lizando teoría de grafos, en redes eléctricas de distribución. Además, 
mediante simuladores eléctricos, el diseñador, puede garantizar la 
viabilidad del proyecto minimizando los costos de implementación. 
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5. Conclusiones 


El modelo de planeación de redes heterogéneas inalámbricas 
conseguido permite visualizar un mapa de ruta para que empresas 
de distribución eléctrica avizoren un panorama mucho más claro 
en lo que respecta al despliegue de la infraestructura de medición 
avanzada que dará paso a medición inteligente de energía eléctrica. 

El modelo propuesto es escalable y flexible, lo que, permite 
incorporar nuevos medidores inteligentes; incorporar tecnologías 
inalámbricas según sea la necesidad; además se puede aplicar a 
zonas urbanas, suburbanas y rurales lo que convierte al modelo en 
una aplicación real para minimizar el tiempo en el despliegue de 
medición inteligente en una ciudad o país. 

El trabajo propuesto advierte que no se requiere usar algorit- 
mos de clusterización para agrupar a medidores inteligentes en un 
punto de agregación de datos debido a la aleatoriedad con la que 
este tipo de algoritmos trabaja, la metodología definida en un previo 
árbol de mínima expansión, un setcover y finalmente un enruta- 
miento usando el algoritmo Dijkstra en su versión desde la estación 
base celular a los medidores inteligentes mantiene un tiempo de 
ejecución adecuado para verificar resultados con diferente número 
de medidores inteligentes. 

Con la presente investigación se ha validado el funciona- 
miento y la confiabilidad de la heurística propuesta en la solución 
óptima de despliegue de transformadores de potencia para redes 
de distribución en media y bajo voltaje observando restricciones de 
capacidad y cobertura. Es un modelo capaz de calcular caídas de 
voltaje en la red de baja tensión para cada transformador empla- 
zado, garantiza la observancia de las restricciones, lo que hace 
que, el mapa de ruta obtenido por el modelo sea el óptimo para su 
respectiva implementación. Además, mediante teoría de grafos y 
rutas mínimas se garantiza que la topología o mapa de ruta obte- 
nido por el presente modelo sea el mínimo y, por lo tanto, el costo 
de implementación, de igual manera, sea el mínimo. El modelo, no 
solo proporciona el mapa de ruta, sino que, proporciona longitud en 
kilómetros de la ruta que debe seguir el tendido eléctrico, cantidad 
de pozos o postes, cantidad y capacidad de los transformadores a 
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emplazarse con valores estandarizados, ubicación georreferenciada 
de los dispositivos dispersos en el área de interés, considera además 
estratificación en base a los consumos tipo y, además, proporciona 
la capacidad requerida de la subestación en MVAs. Por lo tanto, 
el modelo es capaz de dar solución al problema combinatorio de 
complejidad NP-Complete. Por último, mediante el software Cym- 
dist validamos la funcionalidad del modelo y la capacidad de pro- 
porcionar topologías o mapas de ruta óptima para posteriormente 
mediante el simulador analizar el comportamiento estrictamente 
eléctrico considerando parámetros eléctricos no tomados en cuenta 
en la heurística propuesta, tales como, impedancias, coseno phi, 
configuraciones de subestaciones, etc. 

En futuros trabajos implementaremos restricciones de caídas 
de voltaje para la selección de la ubicación georreferenciada de 
los transformadores de distribución y, además, se incluirá flujos de 
potencia en el algoritmo. 
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Resumen 


La localización de fallas en los sistemas eléctricos, especialmente en los de distribución, 
es un problema que afecta no solo a los usuarios, sino también a las empresas presta- 
doras del servicio eléctrico; con mayor tiempo invertido en este período, se incrementa 
las pérdidas por la energía no facturada y las molestias en los usuarios, disminuyendo 
la calidad del servicio. Son distintas las causas por las cuales se incrementa este tiempo, 
entre éstas la confusión que pudiera existir en los sistemas de localización que actúan 
bajo la presencia de fuentes de generación distribuida en las redes de distribución. En 
este sentido, la presente investigación muestra una revisión de los métodos utilizados 
para la localización de fallas en sistemas eléctricos de distribución que tengan presen- 
cia de fuentes de generación distribuida. Las principales características de los métodos 
son estudiadas y sus más recientes aplicaciones para tratar este problema. 
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Abstract 


The location of faults in the electrical systems, especially in distribution, is a problem that 
affects not only the users, but also the companies providing the electric service; with more 
time invested in this period, the losses due to the unbilled energy and the inconvenience 
in the users are increased, decreasing the quality of the service. The causes for which this 
time is increased are different, among them the confusion that could exist in the location 
systems that act under the presence of sources of distributed generation in the distribution 
networks. In this sense, the present investigation shows a revision of the methods used 
for the location of faults in electrical distribution systems that have presence of sources of 
distributed generation. The main characteristics of the methods are studied and their most 
recent applications to deal with this problem. 


Keywords 


Faults, artificial intelligence, distributed generation, electric distribution systems. 


1. Introducción 


Un Sistema Eléctrico de Distribución (SED) es un conjunto de 
instalaciones y equipos encargados de entregar la energía eléctrica a 
los distintos usuarios. En general, existen tres (3) tipos de configura- 
ciones para este tipo de sistema y que se suelen llamar radial, anillo 
y malla, cada una con sus características, ventajas y desventajas. La 
configuración radial es más económica y sencilla de operar, es la más 
común para alimentar cargas de tipo residencial y no críticas [1]. 
Adicionalmente, según su construcción, estos sistemas se clasifican 
en aéreos y subterráneos, siendo los aéreos los más comunes [2]. 

Los SED no son inmunes a las interrupciones del servicio eléc- 
trico ocasionadas por fallas. El tiempo de una interrupción depende 
de la detección de la falla por el dispositivo de protección, su apertu- 
ra y despeje, de la localización de la falla y de la reparación necesa- 
ria para restablecer el servicio. La localización de la falla es el punto 
crítico del proceso y el principal inconveniente está relacionado con 
aspectos de infraestructura, es decir, la mayoría de los circuitos en 
los SED no disponen de localizadores de fallas, la configuración 
de los circuitos no es homogénea, ya que generalmente contienen 
diferentes secciones de conductor, longitudes y presentan múltiples 
derivaciones de cargas a lo largo de cada alimentador [3]. 
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Actualmente, los SED están presentando penetración de Gene- 
ración Distribuida (GD), la cual es universalmente aceptada como 
una solución efectiva y económica para responder a los incrementos 
en las demandas de energía del sistema, debido a que representa 
una mejor opción para corregir los problemas de pérdidas de ener- 
gía, perfiles de tensión, problemas de cargabilidad de líneas, seguri- 
dad y confiabilidad, por mencionar algunos [4]. La integración de la 
GD a los SED convencionales modifica las amplitudes de las señales 
de falla (tensión y corriente) lo cual afecta significativamente la 
exactitud de los algoritmos de localización de fallas [5], por esta 
razón, este problema resulta de importancia tratarlo cuando existe 
presencia de GD en las redes [6]. 

Los métodos algorítmicos han sido utilizados para tratar este 
problema con la presencia de GD. Estos métodos dependen del 
modelo de la red y el error en la localización de la falla aumenta sig- 
nificativamente cuando se incrementa la potencia inyectada por las 
fuentes de GD a los SED [7]. Los autores de [8] utilizan el método 
basado en impedancia para localizar fallas en SED con presencia de 
GD. La técnica es validada en el circuito IEEE de 34 nodos conside- 
rando los diferentes tipos de falla que se puedan presentar con resis- 
tencias de falla entre O y 40 (2 y penetración de GD entre 5 y 50%. 
Los resultados los muestran errores de estimación menores al 2%. 

Los autores de [9] concluyen que los métodos basados en la 
impedancia están influenciados por la resistencia de falla y por la 
distancia entre la falla y el punto de medición. Mientras mayor sea la 
resistencia y la distancia de falla, mayor será el error en la estimación. 
En general, la exactitud de los métodos basados en la impedancia 
depende de los parámetros de la línea, sus características y del valor 
de carga. El error en la localización de estos métodos también se ve 
afectada por la complejidad de la red, como los sistemas no balancea- 
dos, múltiples laterales y resistencias de falla. Para fallas con múltiples 
estimaciones, el estado de los dispositivos de protección se utiliza 
comúnmente para identificar la ubicación real. Sin embargo, para un 
SED que no está equipado con el estado en línea de los dispositivos 
de protección, el problema de la múltiple estimación no podría resol- 
verse [10]. Estos métodos proporcionan exactitud, pero con múltiple 
estimación en la localización de la falla [11]. 
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En [12] localizaron fallas en un SED con presencia de GD uti- 
lizando Redes Neuronales Artificiales (ANN, por sus siglas en inglés) 
con el enfoque estándar de retropropagación. En este método, los 
datos de entrenamiento se basan en la corriente inyectada por cada 
fuente de fuente de GD durante la falla. Por lo tanto, la exactitud 
del método es altamente dependiente del número de fuentes de 
GD en el sistema. El principal inconveniente de las ANN es su alta 
dependencia de la cantidad y la calidad de los datos entrenados 
para producir un algoritmo bien entrenado. Una cantidad limitada 
de información o su inexactitud, afecta el desempeño del algoritmo 
para identificar correctamente la ubicación de la falla. Este proble- 
ma ocurre en los SED con información limitada que resulta de un 
número insuficiente de dispositivos de monitoreo [10]. 

Las Máquinas de Soporte Vectorial (SVM, por sus siglas en 
inglés) han sido utilizadas para localizar fallas en SED con GD. Éstas 
se basan en patrones representados por medidas de tensión y corriente 
en la subestación y en las fuentes de GD. Esta técnica presenta mayor 
robustez cuando se incrementa el número de fuentes de GD en la red. 
En [13] presentan la aplicación de las SVM para diagnosticar fallas 
en SED con la presencia de GD. El enfoque propuesto se basa en las 
tres (3) tensiones y corrientes de fase que están disponibles en todas 
las fuentes, es decir, en la subestación y en los puntos de conexión de 
la GD. La metodología propuesta es ilustrada en un alimentador de 
distribución de la subestación de 132/11kV en la India con cargas en 
diferentes lugares y varias fuentes de GD. El esquema de localización 
de fallas propuesto es capaz de identificar con exactitud el tipo de 
falla, la ubicación de la sección del alimentador en falla y la impe- 
dancia de falla. El resultado de la simulación muestra el rendimiento 
satisfactorio en términos de clasificación y regresión. La exactitud 
de la clasificación para la línea en falla fue de 100, 99,95 y 92,06%, 
con tres (3) fuentes de GD, dos (2) fuente de GD y una (1) fuente 
de GD, respectivamente. Para cualquier cambio en la topología del 
sistema, las SVM tiene que ser reentrenadas antes de su aplicación. 
Además, con un mayor número de fuentes de GD, el enfoque se hace 
más robusto. Diferentes esquemas de localización de fallas en SED 
han sido estudiados considerando los métodos tradicionales basados 
en el modelado matemático del sistema, en ondas viajeras de altas 
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frecuencias, en inteligencia artificial y la integración de dos (2) o 
más de éstos, resultando en nuevas investigaciones que buscan dar 
solución a este problema. En este sentido, en esta investigación se 
presenta la revisión de los principales métodos para la localización 
de fallas en SED con presencia de GD. La descripción de los SED, la 
GD y las metodologías existentes para tratar este problema se pre- 
sentan en las siguientes secciones, finalizando con las conclusiones. 


2. Sistemas eléctricos de distribución 


Los Sistemas Eléctricos de Potencia (SEP) y la prestación del 
servicio eléctrico incluyen las actividades de generación, transmi- 
sión, distribución, despacho y comercialización final de la ener- 
gía. Entre estas actividades, la de distribución es conocida como 
el “gigante invisible” [2], por ser aproximadamente el 66% de la 
inversión total del sistema, lo que implica que se debe realizar un 
trabajo riguroso a la hora de planificar, diseñar, construir, operar 
y mantenerlo. Su función primordial es llevar la energía eléctrica 
generada en las centrales a los usuarios finales y entregarla con los 
requisitos de calidad exigidos, es decir, de manera, segura, confiable 
y de adecuada prestación [14]. 

Los SED están constituidos por las subestaciones, conductores, 
transformadores y demás elementos de un sistema eléctrico que sir- 
ve para llevar la energía eléctrica desde la subestación distribuidora 
hasta los usuarios finales. Esta subestación incluye transformadores 
de potencia, barras, condensadores, seccionadores y reconectadores, 
entre otros elementos. Los alimentadores primarios de distribución, 
a la salida de las subestaciones, son trifásicos y operan a tensiones 
que van desde 1.000 V hasta 34.5 kV y se encargan de distribuir 
la energía a los centros de consumo. A partir de estos centros se 
tienen sub-alimentadores ramales trifásicos y/o monofásicos. Los 
transformadores de distribución pueden ser de diferentes tipos y 
configuraciones y sus potencias nominales van desde 10 a 500 kVA 
y suelen instalarse en los alimentadores primarios y sub-alimenta- 
dores para reducir el nivel de tensión de distribución en su circuito 
secundario al requerido por los usuarios [1]. Estos sistemas se cla- 
sifican de manera más general, en función de la disposición de sus 
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conductores y equipos, en aéreos y subterráneos. En la Figura 1 se 
muestra un SED típico. 


Líneas de sub-transmisión 


Sub-estación de 
distribución 





Alimentador primario 
Sub-alimentador 


ateral monofásico 
ón 3 e 
<A Transformador de a y 
E) distribución 


Red secundaria 


Usuarios 


Figura 1. SED típico 


Fuente: Adaptación de [15] 


Según [2], las actividades de los SED están en constante evolu- 
ción, por mencionar algunos de estos nos encontramos: 
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e Expansión de las cargas. 

e Normalización de los materiales, estructuras y montajes. 

e Técnicas de diseño, análisis y operación. 

e Métodos de trabajos específicos y normalizados. 

e Programas de prevención de accidentes y de mantenimientos. 
e  Surgimiento de nuevas empresas de fabricación de equipos. 

e Grandes volúmenes de información, datos y planos. 


Los SED son de grandes longitudes y número de equipos, por 
lo que los estudios para garantizar la calidad de la energía eléctrica 
prestada a sus usuarios son complejos de realizar, porque se involu- 
cran un sinnúmero de variables. 


1) Interrupciones y las causas de fallas 


Las interrupciones del servicio eléctrico tienen una multitud 
de origen o causas, por lo que es necesario realizar una clasificación 
y análisis de éstas con el fin de minimizarlas. Una primera clasifica- 
ción que se puede hacer es en base a su naturaleza, según ésta las 
interrupciones pueden ser programadas o forzadas [11]. 

Las interrupciones programadas son previstas, ya que con sufi- 
ciente antelación se les informa a los usuarios afectados, para que 
puedan tomar las distintas previsiones que minimicen el impacto 
causado por la falta del suministro de energía eléctrica. Este tipo de 
interrupciones suelen ocurrir por labores de mantenimiento, amplia- 
ciones o maniobras de la red. 

Las interrupciones forzadas son consideradas más perjudiciales, 
por su carácter imprevisto, debido a que los usuarios no tienen oportu- 
nidad de tomar medidas que el caso requiera. Según [16], estas últimas 
se clasifican de manera general según su origen el cual puede ser: 


e Origen desconocido: Incluye todas las interrupciones cuyas cau- 
sas se desconocen, suelen ser transitorias y no dejan algún rastro. 

e Origen climatológico: Incluye todas las interrupciones que tie- 
nen su origen en fenómenos climatológicos, tales como lluvias 
o descargas atmosféricas. 
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Origen externo: Incluye las interrupciones debidas a agentes 
externos al sistema eléctrico como son los animales (aves, roedo- 
res), árboles, ramas, vehículos, personas, por nombrar algunos. 
Origen interno: Incluye todas las interrupciones causadas por 
agentes o elementos pertenecientes al sistema eléctrico, entre 
los cuales destacan: falla en algún componente de la red, falla 
en los sistemas de protección, falla humana en el manejo del 
sistema, por nombrar algunos. 


Según [17], otra forma de clasificar las interrupciones es de 


acuerdo con su duración, entre las cuales destacan: 


Momentáneas: Una interrupción momentánea se presenta cuan- 
do el valor eficaz de la tensión de suministro disminuye a un 
valor por debajo de 0,1 por unidad (pu) y durante un tiempo 
inferior a los tres ciclos (50 ms), pero superior o igual al medio 
ciclo (8,33 ms). No requiere la intervención humana para repa- 
rar y restablecer el normal funcionamiento del sistema 
Temporales: Una interrupción temporal se presenta cuando el 
valor eficaz de la tensión de suministro disminuye a valores 
por debajo de 0,1 pu, durante un tiempo inferior a un (1) 
min, pero superior o igual a los tres ciclos (50 ms). Tampoco 
requiere la intervención humana para reparar y restablecer el 
normal funcionamiento del sistema 

Permanentes o Sostenidas: Una interrupción permanente del 
servicio se origina cuando el valor eficaz de la tensión en el 
punto de suministro disminuye por debajo de 0.1 pu durante 
un tiempo superior a un (1) min. Este tipo de interrupción 
requiere la intervención humana para localizar, reparar y res- 
tablecer el normal funcionamiento del sistema y son las que 
mayor afectan la continuidad del servicio eléctrico. 


Existe una clasificación más general para las interrupciones, 


que según su tiempo de duración pueden ser de corta o larga dura- 
ción, en función de que la misma sea menor o mayor a un (1) minu- 
to respectivamente. La tabla 1 muestra los requisitos establecidos 
por países europeos para establecer los límites de calidad. Adicional- 
mente, la tabla 2 muestra los datos de frecuencia y tiempo de dura- 
ción promedio de las interrupciones de países de la misma región. 
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Tabla 1. Requisitos de las interrupciones en diferentes países europeos 


Número de Número de 
eventos de larga | eventos de corta 
duración duración 


Duración por Indisponibilidad 
evento (hr/evento) (hr/año) 


—RA 
o E Er 
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Tabla 2. Promedios de interrupciones del servicio eléctrico en países 
europeos durante el período 1996-2002 


| AAA Tiempo de Indisponibilidad del 
(evento por año) servicio eléctrico (min/año) 
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Hay diversas causas de fallas en los SED, según estudios lle- 
vados a cabo por el Instituto de Investigación de Potencia Eléctrica 
(EPRI, por sus siglas en inglés) aproximadamente el 40% de fallas 
ocurren durante períodos de condiciones climáticas adversas que 
incluyen la lluvia, la nieve y el hielo [18]. 


3. Generación distribuida 


Según [19], GD significa generadores de pequeña capacidad 
de potencia conectados directamente a los SED; su propósito es pro- 
porcionar una fuente de energía eléctrica activa [20]. Ésta es consi- 
derada como una opción importante para solucionar la mayoría de 
problemas en los SED, tales como pérdidas en las líneas, perfiles de 
tensión, cargabilidad de las líneas, confiabilidad y también alcanzar 
el objetivo de utilizar recursos energéticos verdes y renovables [4]. 

La capacidad máxima de GD que puede conectarse a un SED 
depende de su potencia, la cual está correlacionada con su nivel de 
tensión. El diseño técnico de cada SED es único, por lo tanto, no se 
puede dar una definición general de la capacidad máxima que se puede 
conectar, sin embargo, de acuerdo con el rango de potencia de la GD 
se sugieren algunas clasificaciones, tal como se muestra en la Tabla 3. 


Tabla 3. Clasificación de la GD de acuerdo con su rango de potencia 


Clasificación de la GD Rango de potencia 
Ost 


ET 
RENT 
SOM 00M 





Fuente: [20] 


De acuerdo con el tipo de tecnología disponible, la GD varía 
ampliamente, muchas de las tecnologías utilizan recursos de ener- 
ela renovable. Estos se definen como recursos que generalmente no 
están expuestos al agotamiento, como la luz solar, la fuerza del vien- 
to, la materia orgánica (biomasa) y la del océano, por mencionar 
algunos. Otro tipo de fuentes de GD de acuerdo con su tecnología, 
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son las provenientes de la producción combinada de calor y electrici- 
dad. Las turbinas de gas de ciclo combinado, motores de combustión 
interna, turbinas de combustión y pilas de combustible son parte de 
este ciclo combinado. En la Tabla 4 se muestra los valores típicos de 
potencia de GD de acuerdo con su tecnología. 


Tabla 4. Valores típicos de potencia de GD de acuerdo con su tecnología 


Turbina de gas de ciclo combinado 35 - 400 MW 
50M 


Turbinas de combustión 1 - 250 MW 

Micro turbinas 35kW - 1 MW 
Renovables 

Micro hidroeléctricas 25kW - 1 MW 

Pequeñas hidroeléctricas 1 - 100 MW 

Turbina eólica 200 W - 3 MW 


Arreglos fotovoltaicos 20 W - 100 kw 


Solar térmica 1-10MW 


Los SED se diseñan generalmente en un esquema radial, que 
tradicionalmente se alimenta desde la subestación ubicada aguas 
arriba en el inicio del circuito. Por lo tanto, se tiene un flujo de 
potencia unidireccional y una misma corriente dirigida desde la sub- 
estación hacia el alimentador aguas abajo, lo que facilita el cálculo 
de corriente de falla. Por otro lado, el nivel de tensión de las barras 
disminuye en la medida en que se encuentren más alejadas de la 
subestación, por esta razón, tienen un bajo perfil de tensión que 
debe ser corregido por bancos de condensadores, compensadores 
síncronos, Sistemas Flexibles de Transmisión en Corriente Alterna 
(FACTS, por sus siglas en inglés) o fuentes de GD en estos puntos 
débiles. Aunque la adición de GD en los SED mejora el perfil de 
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tensión, cambia drásticamente las características del sistema, par- 
ticularmente en cuanto a la condición de falla y la respuesta de los 
dispositivos de protección, influyendo en los niveles de corriente y 
en la contribución de las fuentes [4]. 


4. Revisión sobre los métodos de localización de fallas 


Los aspectos mayormente considerados por los métodos de 
localización de fallas en los SED están directamente relacionados 
con sus características, tales como heterogeneidad de los alimen- 
tadores (debido a los diversos tamaños y longitudes de los conduc- 
tores), desbalances (debido a la presencia de cargas monofásicas 
y/o trifásicas) y la presencia de laterales a lo largo del alimentador 
principal, por mencionar algunos. Estos aspectos pueden introdu- 
cir errores en la estimación de la localización de la falla si se usan 
modelos simplificados [11]. 

Los métodos de localización de fallas en SED pueden dividirse 
en tres (3) categorías, según [21]: 


1. Métodos basados en la inspección visual. 
2. Métodos convencionales. 
3. Métodos basados en Inteligencia Artificial. 


1) Métodos basados en la inspección visual 


Inicialmente la localización de fallas en SED se realizaba de 
manera visual. Los dispositivos de protección en las subestaciones 
o el reclamo realizado por los usuarios del servicio a causa de una 
suspensión alertaban a cuadrillas de personal especializado a loca- 
lizar las fallas de manera visual, para poder repararla y restablecer 
nuevamente el servicio. El tiempo total de indisponibilidad del ser- 
vicio era función de la alerta de la falla, su localización y del tiempo 
utilizado para la reparación y restablecimiento, el cual podría variar 
de unos cuantos minutos a horas y días, dependiendo de diversos 
factores, entre estos, tipo de configuración (aérea o subterránea), 
de circuito (urbano o rural), de causa de la falla (agentes externos 
o internos al sistema), entre otros. 
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Los requerimientos de la calidad en la prestación del servicio 
hicieron que fuera cada vez más exigente reducir tiempos de indis- 
ponibilidad del servicio y para poder llevar un control de los mis- 
mos comenzaron a aparecer los indicadores, según las regulaciones 
establecidas [22], [23]. La norma IEEE Std 1366 [24] incluye una 
variedad de indicadores en función del número de clientes o usuarios 
afectados, la potencia interrumpida o la cantidad de energía dejada 
de suministrar, relativo a cuantificar los efectos relacionados a la sus- 
pensión del suministro eléctrico. Las iniciativas para reducir los tiem- 
pos de indisponibilidad del sistema de manera diferente a la inspec- 
ción visual comenzaron a aparecer, como se presentan a continuación. 


2) Métodos convencionales 


Estos incluyen a los métodos basados en la impedancia y en 
ondas viajeras [21] 


2.1.Métodos basados en la impedancia 


Según [25], los métodos basados en la impedancia usan las 
mediciones de tensión y corriente de la frecuencia fundamental dispo- 
nibles en la subestación e información como topología del SED, datos 
de líneas y cargas para encontrar la localización de la falla. A dife- 
rencia de las líneas de transmisión, los alimentadores de distribución 
suelen tener cargas intermedias significativas, mientras que las medi- 
ciones de tensión y corriente sólo están disponibles en la subestación 
y/o en la fuente de GD. Por lo tanto, estos métodos inician el proceso 
de localización de fallas desde la primera sección de línea y resuelven 
iterativamente las ecuaciones que describen la condición de estado de 
falla para todas las secciones, una por una, para hacer una estimación 
de la distancia. En la Figura 2 se ilustra este método. 
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Figura 2. Método de localización de falla basado en la impedancia 


La formulación de la distancia de ocurrencia de la falla se 
puede expresar por medio de la ecuación (1): 





V l 
En (1) 
[xZ) 
donde: 
V: Tensión durante la falla en V. 
I: Corriente durante la falla en A. 
Z,: Impedancia de la línea en Ohm por unidad de longitud 
d: Distancia de la falla (m) 


Anteriormente, los métodos basados en la impedancia no 
consideraban la presencia de la GD [26]-[28]. Se han desarro- 
llado algunas técnicas basadas en la impedancia para considerar 
la presencia de GD. Inicialmente estos métodos se basaban en la 
modificación o re-coordinación de los dispositivos de protección 
existentes en el SED y el objetivo era la identificación de la zona 
que presentaba la falla, pero sin una localización exacta de la misma 
[29]. Para determinar la localización exacta de la falla se han consi- 
derado diferentes parámetros, entre éstos variaciones en la tensión 
medida en la subestación y en las fuentes de GD antes y durante la 
falla [30], [31], uso de las componentes simétricas [32]-[35], entre 
otros. En la Tabla 5 se muestran los resultados de aplicación de los 
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métodos basados en la impedancia para la localización de fallas en 
SED con GD. 

Sin embargo, cuando un SED tiene diversos laterales con pre- 
sencia de fuentes de GD, la exactitud de este método es cuestionable 
[36]. El hecho que un alimentador tenga diversos laterales aumenta 
la complejidad de localizar la falla. Esto se debe principalmente a 
que la estimación de la localización de la falla produce más de una 
ubicación [37]. De igual manera, el modelo de línea utilizado en el 
SED afecta la exactitud de estos métodos, en el caso de líneas de dis- 
tribución cortas, las capacidades de derivación son despreciables y el 
modelo de línea corta es suficiente. Sin embargo, para líneas aéreas o 
subterráneas largas, el efecto de la admitancia de derivación es mayor 
y puede resultar en errores de estimación si no se modela correcta- 
mente. En general, un correcto modelado de las líneas del SED mejo- 
rará la exactitud de los resultados. Por otro lado, modelos detallados 
aumentarían la complejidad y la carga computacional [25]. En la 
Tabla 5 se muestran los resultados de aplicación de los métodos basa- 
dos en la impedancia para la localización de fallas en SED con GD. 


2.2.Métodos basados en ondas viajeras 


Este método se basa en el principio de transmisión y reflexión 
de las ondas que se producen entre el terminal de línea y el punto de 
falla. En la Figura 3 se ejemplifica el método de las ondas viajeras. 
Cuando se produce una falla, se generan ondas de alta frecuencia 
de corrientes y tensiones que se propagan hacia ambos extremos. En 
los puntos de discontinuidad, como circuito abierto, cortocircuito o 
terminales de línea, una parte de la onda incidente se refleja hacia 
atrás mientras otra parte viaja hacia más allá de la discontinuidad. 
Las ondas se reflejan hacia adelante y atrás entre el punto de falla 
y los dos (2) terminales hasta que se alcanza el estado estacionario 
post-falla [25]. 
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Nodo de Medición 





Falla 


Figura 3. Método de las ondas viajeras 
Fuente: [21] 


En la Figura 3, t, es el tiempo que tarda la onda viajera en lle- 
gar al punto de falla desde el nodo de medición, t, es el tiempo que 
tarda la onda reflejada desde el punto de falla al nodo de medición 
y f, es la distancia de falla medida desde el punto de medición. La 
distancia de falla se determina usando (2) 


la = eN Ñ o 


Para cada localización de falla, los transitorios registrados 
contienen algunas frecuencias características dominantes en fun- 
ción de la longitud de las trayectorias de desplazamiento y de las 
velocidades de propagación que proporcionan información valiosa 
sobre su ubicación. Sin embargo, la interpretación de los transito- 
rios, especialmente para SED ramificados, son computacionalmente 
difíciles [25]. Por lo tanto, los métodos basados en ondas viajeras se 
soportan principalmente en técnicas de procesamiento de señal tales 
como transformaciones de onda para simplificar el análisis, entre 
éstas se encuentra la transformada de Wavelet, la cual es una trans- 
formación lineal similar a la transformada de Fourier, que permite 
una representación tiempo-frecuencia de la señal. Esta propiedad es 
particularmente útil para la localización temporal de transitorios de 
falla que tienen componentes de alta frecuencia y de corta duración 
superpuestos a formas de onda continuas de frecuencia de potencia. 
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El método de ondas viajeras requiere de dispositivos de adqui- 
sición de datos de alta velocidad, sensores, detectores de transito- 
rios de falla y GPS para capturar la forma de onda transitoria para 
localizar la falla. La ventaja de este método es que no se ve afectada 
por la variación de la carga ni por altos valores de resistencia de 
conexión a tierra [21]. 

El método de ondas viajeras ha sido aplicado para la loca- 
lización de fallas en SED con GD, basado en la transformada de 
Wavelet [38], [39] y en mediciones múltiples en el sistema [40]. 
En la Tabla 6 se muestran los resultados de aplicación de los méto- 
dos basados en ondas viajeras para la localización de fallas en SED 
con GD. 


3) Métodos basados en Inteligencia Artificial 


Debido a la complejidad de los SED y los diversos factores de 
incertidumbre, como la característica de los conductores (longitud 
y calibre) y el valor de la resistencia de falla, los cuales son difíciles 
de abordar con los métodos basados en la impedancia y las ondas 
viajeras, han aparecido métodos basados en el conocimiento para la 
localización de fallas en estos sistemas. En general, estos métodos 
requieren de patrones que caractericen la falla tales como las medi- 
ciones de tensión y corriente. 

La Inteligencia Artificial (IA) es un subcampo de la informáti- 
ca que investiga cómo el pensamiento y la acción de los seres huma- 
nos pueden ser imitadas por las máquinas [41]. Tanto los cálculos 
numéricos, no numéricos y simbólicos están incluidas en el ámbito 
de la IA. La imitación de inteligencia incluye no sólo la capacidad de 
tomar decisiones racionales, sino también para hacer frente a infor- 
mación con datos faltantes, adaptarse a las situaciones existentes y 
mejorarse a sí misma en el horizonte a largo plazo sobre la base de 
la experiencia acumulada. Estos métodos basados en IA para locali- 
zar fallas en SED se mencionan a continuación. 


3.1.Redes neuronales 


Una Red Neuronal Artificial (ANN, por sus siglas en inglés) es 
un conjunto de neuronas primarias que están conectados juntas en 
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diferentes arquitecturas organizadas en capas que están inspirada en 
la estructura del sistema nervioso de los seres humanos [41]. Las ANN 
son diferentes de los sistemas expertos, ya que no necesitan una base 
de conocimiento para trabajar. En su lugar, tienen que ser entrenadas 
con numerosos casos reales. Las ANN es uno de los métodos conoci- 
dos y confiables en la solución de problemas de ingeniería relaciona- 
dos con la clasificación y optimización y por la capacidad que tienen 
en el reconocimiento de patrones complejos, su uso se ha extendido a 
la localización de fallas en SED. En la Figura 4 se presenta la estruc- 
tura de una ANN feedfoward conocida como perceptron. 


Capa de Capas Capa de 
entrada A ocultas 5 salida 





Entrada Salida 





Figura 4. Representación gráfica de las ANN 


Fuente: [41] 


De la Figura 4 se distingue una capa de entrada la cual está 
compuesta por neuronas que reciben datos o señales procedentes 
del entorno. La capa de salida que está compuesta de neuronas que 
proporcionan la respuesta de la red neuronal. Una capa oculta que 
no tiene conexión directa con el entorno y proporciona grados de 
libertad a la red neuronal lo que le permite representar de manera 
más aproximada determinadas características del entorno que trata 
de modelar. Los datos primero ingresan a la capa de entrada luego 
pasan por la capa oculta y finalmente el resultado se obtiene en la 
capa de salida. Para la localización de fallas en sistemas eléctricos de 
distribución, los datos de entrada de la ANN pueden ser mediciones 
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realizadas en el circuito, tales como tensión, corriente, el estado 
de los dispositivos de protección, entre otros. La salida de la ANN 
corresponde a la ubicación de la falla. En la Tabla 7 se presentan los 
resultados de la aplicación de las ANN en la localización de fallas 
en SED con GD. 

La localización de fallas basada en ANN sufre de inexactitudes 
debido a las variaciones continuas de carga e impedancia de la fuente 
[41]. De igual manera, es altamente dependiente de la cantidad y 
calidad de los datos entrenados para producir un adecuado algoritmo, 
por lo tanto, una cantidad limitada de información afecta la eficiencia 
del método. Este problema ocurre en los SED con información limita- 
da resultante de un número insuficiente de dispositivos de monitoreo. 
Otra desventaja de las ANN es que el proceso de entrenamiento tiene 
convergencia lenta. Además, los parámetros como las capas ocultas, 
las neuronas y la tasa de aprendizaje se identifican utilizando casos 
de prueba y error. De igual manera, las ANN deben ser reentrenadas 
cada vez que el SED experimente cambios [21]. 


3.2.Máquinas de soporte vectorial 


Las bases de esta herramienta fueron desarrolladas por Vla- 
dimir Vapnik [42] y son populares debido a muchas características 
atractivas y prometedoras que presenta. La formulación incorpora la 
Minimización del Riesgo Estructural (SRM, por sus siglas en inglés) 
que se ha demostrado ser superior al principio de Minimización del 
Riesgo Empírico (ERM, por sus siglas en inglés), empleado por las 
ANN convencionales [43]. La SRM minimiza un límite superior en 
el riesgo esperado, en contraposición a ERM que minimiza el error 
en los datos de entrenamiento. Es esta diferencia la que equipa las 
SVM con una mayor capacidad de generalizar, que es el objetivo en 
el aprendizaje estadístico. Las SVM se han desarrollado para resol- 
ver el problema de clasificación y regresión [44]. 

El concepto de las SVM se muestra en la Figura 5 para la cla- 
sificación entre dos (2) clases (clase 1 y clase 2). Los puntos se mar- 
can usando el conjunto de entrenamiento de los datos de tensión 
y/o corriente tomados en el nodo de medición para la clasificación 
de fallas. Los vectores de soporte son los elementos de los conjuntos 
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de entrenamiento, que identifican el Hiperplano de Separación Ópti- 
ma (OSH, por sus siglas en inglés). Los círculos representan la clase 
1 y los cuadrados la clase 2. La entrada para las clases 1 y 2 son del 
nodo de medición (tensión y/o corriente) y la salida es la ubicación 
de la falla. El OSH separa todas las muestras y también maximiza el 
margen entre los dos (2) planos paralelos que contienen el conjunto 
de clases. El margen se define como la suma de la distancia mínima 
entre el conjunto de datos de entrenamiento y el OSH. En la figura 
5 se muestra la representación gráfica de las SVM. De (3) a (6) se 
muestran las ecuaciones de los planos paralelos al OSH, el margen 
y la distancia al origen. 

P, 
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Figura 5. Representación gráfica de las SVM 


P,:(W.x)+b=>+1 (3) 
Wo o Z (5) 
a eo, e == rre are 
pa + 2%) = Tp 
(W.x,)+b _ b (6) 
[wi] [[w| 


Para encontrar el OSH se debe maximizar el margen (5), con- 
siderando la restricción de que no existan datos dentro del margen, 


lo q 4 (7) 
ade 5 (W. w 
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sujeto a y;¡(W.x, + b) > 1, Vi (8) 


La ecuación (7) se llama función objetivo y, junto con (8), 
representa el problema de optimización cuadrático con restriccio- 
nes, lo que puede ser resuelto utilizando el método de los multipli- 
cadores de Lagrange, denotados por la ecuación (9) 


n 


1 
155,4) =51W?-) «I+D 0) 
i=1 
Para el caso de que existan intersecciones en los datos de entre- 
namiento (datos no separables), tal como se muestra en la Figura 6, 
los puntos que se encuentran en la intersección no pueden ser clasifi- 
cados correctamente y sus correspondientes tenderán al infinito. 





Figura 6. Hiperplano clasificador óptimo para caso no separable 
En [42] introducen las variables slack o de relajación para per- 


mitir datos que violen las restricciones. De esta manera para obtener 
el OSH corresponde a minimizar la expresión (10) 


min|1,_ -, 4 
xe : (W.w) + CL, e (10) 


Sujeto a y¿,(W.x, + b) > 1-—€¡,Vi 
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El parámetro C se elige por conveniencia por el usuario, de tal 
manera que, un valor grande sea una alta penalización a los errores. El 
valor óptimo de C se obtiene por medio de una validación cruzada [45]. 

Cuando los datos no son separables, se mapea el espacio de 
entrada a un espacio de representación de una dimensión mayor a 
través de una función no lineal elegida por conveniencia [46], tal 
como se muestra en la figura 7. 


Kernel 

















Figura 7. Transformación del espacio de entrada al espacio característico 


Por medio de una función (Dd) se trazan los datos de entrada 
a algún espacio de mayor dimensión donde se puede manejar una 
separación lineal. Este espacio es llamado espacio característico (F) 
y es denotado por la relación (11). 


D:RN > F (11) 


La función (Dd) se define como el producto punto de los vectores 
en el espacio característico tal como se muestra en la ecuación (12). 


(tx) = 07).0(5) (2) 
La ecuación (12) se conoce también como la función Kernel (k) y 


entre las más usadas se encuentran la lineal, la RBE la polinomial y 
la sigmoide. Estas funciones se muestran en la Tabla 8. 
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Tabla 8. Funciones Kernel más usadas 
== 2 
TZ 


y,r y d son los parámetros de la función kernel. 
Fuente: [45] 





Una SVM es un algoritmo de aprendizaje utilizado típicamente 
para resolver problemas de clasificación binaria y luego se exten- 
dieron para tratar problemas con múltiples clases. Estas múltiples 
clases son las que se presentan en la localización de fallas en SED y 
se resuelve por medio del esquema propuesto por [47]. En la Tabla 
9 se presentan los resultados de la aplicación de las SVM en la loca- 
lización de fallas en SED con GD. 


4. Métodos integrados 


Se dan tres (3) tipos de métodos para localizar las fallas en 
SED conocidos como la inspección visual, el basado en la impedan- 
cia y las ondas viajeras y los métodos inteligentes. Sin embargo, 
éstos todavía presentan algunos problemas, por ejemplo, el método 
basado en ondas viajeras puede enfrentarse a problemas tales como 
alta frecuencia de muestreo y estructura compleja, los métodos 
inteligentes pueden ser problemáticos debido a la necesidad de un 
banco de datos grande y detallado [48]. Finalmente, los métodos 
basados en la impedancia presentan problemas de múltiple estima- 
ción como se menciona en apartados anteriores. 

El siguiente método consiste en la combinación de más de un 
método de localización de fallas y permite aprovechar la fortaleza de 
cada uno de éstos y así se podría obtener una mejor exactitud, este 
se conoce como método integrado [10]. En la Tabla 10 se muestra 
los métodos integrados para la localización de fallas en SED. Cabe 
destacar que tales combinaciones, además de sus ventajas, también 
traen desventajas. Si bien, la ventaja común de los mencionados 
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métodos integrados es su capacidad para superar el problema de 
estimación múltiple, tienen requerimientos adicionales en compa- 
ración con los algoritmos basados en impedancia tales como datos 
de entrenamiento, mediciones con mayor frecuencia de muestreo, 
medidas dispersas de tensión, por mencionar algunos. Para finalizar, 
en la Tabla XI se presenta una comparación de los diferentes méto- 
dos propuestos de localización de fallas en SED con GD. 


5. Conclusiones 


La localización de fallas en SED con GD es una problemática 
que ha sido abordada con diferentes técnicas, las cuales tienen sus 
ventajas y desventajas. Estas técnicas abarcan la inspección visual, 
los métodos convencionales, la inteligencia artificial y los métodos 
integrados. En esta investigación se presenta una revisión de los 
principales métodos utilizados para tratar el problema. Cada uno de 
ellos presenta sus ventajas y desventajas con errores de estimación 
aceptables. Se evidencia una tendencia a integrar los métodos exis- 
tentes para mejorar los resultados. La presencia de GD en los SED 
extiende las investigaciones del tema debido a los efectos directos 
que tiene sobre las metodologías convencionales que daban solución 
al problema de localización de fallas en SED. 
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Resumen 


El término “ciudades inteligentes” es asociado únicamente con el empleo de tec- 
nologías de la información en la infraestructura de una ciudad. Sin embargo, un 
aspecto fundamental para satisfacer las necesidades de una población es el aprove- 
chamiento de recursos naturales, entre ellos el agua. En este sentido, las técnicas 
de aprovechamiento de agua deben ser sostenibles y amigables con el ambiente, 
este puede ser el caso de la cosecha de neblina. En este estudio, se presenta una 
metodología para cuantificar la intercepción de neblina por un sistema de captación 
y evaluar su potencial como una fuente de agua alternativa. Esta metodología fue 
probada en un sitio experimental en la parte alta de la isla San Cristóbal (Galápa- 
gos). Se realizó un monitoreo de dos meses que incluyó la medición de las princi- 
pales variables meteorológicas y la intercepción de neblina. Se utilizaron tres col- 
ectores de neblina, un cilíndrico (CFC), y dos colectores estándar de 35% (SFC35) 
y 50% (SFC50) de coeficiente de sombra, respectivamente. Dado que los colectores 
captan tanto neblina como lluvia, se utilizó un modelo geométrico para separar 
estas dos variables. Los resultados de este estudio muestran que los colectores CFC, 
SFC35 y SFC5O tienen un rendimiento de 3.7, 4.1 y 4.8 mm/día, respectivamente. 
El colector SFC5O es el que tiene un mejor rendimiento de intercepción de neblina, 
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el que puede ser atribuido a su alta eficiencia aerodinámica comparada con los 
otros. Al analizar las variables meteorológicas se evidencia que el potencial de cap- 
tura de neblina puede ser aún mayor. 
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Abstract 


The term “smart cities” is usually associate to the use of information technologies in a city 
infrastructure. Nevertheless, the use of natural resources, such as water, is an important 
aspect to satisfy the inhabitants necessities. In this sense, techniques to supply water must 
be sustainable and environmentally friendly, which is the case of fog water collection. In 
this study, we present a methodology to quantify fog water intercepted by a fog gauge 
system and to assess its potential as a source of water supply. This methodology is tested in 
an experimental site located at the highlands of San Cristobal Island (Galapagos), which 
included two months monitoring of the main meteorological variables and fog intercep- 
tion. Three fog gauges were used to quantify fog interception, a cylindrical (CFC) and 
two standards of 35% (SFC35) and 50% (SFC50) shading coefficient, respectively. Given 
that fog gauge collectors capture both fog and rainfall we used a geometrical model to 
separate both variables. Results show that collectors* CFC, SFC35 and SFC50 have an av- 
erage performance of 3.7, 4.1 and 4.8 mm/day, respectively. SFC50 collector presents the 
best performance which can be related to its relative higher aerodynamic efficiency. The 
analysis of the meteorological variables evidences that fog water collection potential can 
be even higher at this site. 
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1. Introducción 


En los últimos años, el término “ciudades inteligentes” se ha 
utilizado con mayor frecuencia en la política de gobiernos y munici- 
pios, en artículos científicos, e inclusive en medios de comunicación 
masivos y redes sociales. Esta popularidad se alcanzó, debido al 
constante debate de cómo las nuevas tecnologías podrían ayudar a 
mejorar la habitabilidad en áreas urbanas. 

No existe un concepto claro sobre qué son las ciudades inteli- 
gentes, debido a que su definición depende de la visión que se tenga 
de las mismas [1]. Mientras varios autores relacionan este concepto 
con el empleo de tecnologías de la información en la infraestructura 
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de una ciudad o al desarrollo de negocios (ej. [2]-[7] otros autores 
orientan este concepto hacia el bienestar y desarrollo de sus habitantes 
(ej. [8]-[11]) , y pocos hacia el tema ambiental (ej. [12]-[14]), como 
el manejo adecuado de los recursos naturales. Tanto Albino et al., 2015 
[1] y Batisha, 2015 [15] concluyen que dicho concepto es único para 
cada ciudad y depende de las necesidades de la misma. 

Sin duda alguna, una de las necesidades más importantes de 
toda ciudad, es el aprovechamiento de recursos naturales, entre 
ellos el agua. Además de que el agua es un elemento fundamental 
para la supervivencia de los seres vivos, también es un factor impor- 
tante en los procesos de producción, para el desarrollo económico 
de una población e inclusive para la recreación de sus habitantes. 
Sin embargo, muchas regiones en el mundo sufren de falta de agua 
[16]-[18]. En al año 2000, de 1.2 a 2.4 billones de personas (20 
al 39% de la población mundial) vivía en cuencas hidrográficas 
expuestas a falta de recursos hídricos [19]-[24]. Tanto el incremen- 
to de la población y el crecimiento del desarrollo económico global, 
son factores importantes para el crecimiento de la escasez del agua 
de los habitantes. También, el cambio climático constituye un factor 
clave para la evaluación de la disponibilidad de recursos hídricos, 
cambios en la temperatura y en los patrones de precipitación resul- 
tan una amenaza para el abastecimiento de agua en varios sitios. 
Varios autores [16], [18]-[25] han utilizado diferentes modelos 
hidrológicos y modelos climáticos globales con diversos posibles 
escenarios para estimar la disponibilidad de agua en años futuros, se 
espera que para el año 2050, entre el 37 y 53% de población global 
viva en regiones con problemas de falta de agua. En la actualidad, 
muchos países ya están tomando conciencia de este asunto. Países 
como Australia [26], China [27], España [28], [29] y Estados Uni- 
dos [30], ya están contemplando medidas y se encuentran buscando 
alternativas para asegurar el abastecimiento de sus poblaciones. En 
este contexto, una ciudad inteligente debe tomar en cuenta el pro- 
blema de fuentes de agua para el suministro de sus habitantes. 

En la actualidad, el abastecimiento de agua para las poblacio- 
nes proviene de dos fuentes principales: 1) el agua superficial de ríos 
y lagunas, conocida como “agua azul”, en donde el agua es tomada 
a través de infraestructura hidráulica; y ii) el agua subterránea, 
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conocida como “agua verde”, en donde el agua es extraída de acuí- 
feros mediante el bombeo de pozos y usos de galerías. Es claro que 
las poblaciones que se ubican cerca de fuentes superficiales de agua 
pueden aprovechar este recurso. Sin embargo, no se tiene certeza 
sobre el efecto que tendría el cambio climática en la disponibilidad 
de las misma [18], dicha incertidumbre podría contemplar una 
disminución en su cantidad. Las poblaciones que se benefician de 
aguas subterráneas tienen la dificultad de que estas fuentes son muy 
susceptibles a la contaminación o a la intrusión del agua del mar (en 
el caso de zonas costeras), además de la incertidumbre en cuanto al 
cambio climático (existe la posibilidad que las precipitaciones sean 
más intensas y esporádicas, generando mayor escorrentía y posi- 
blemente reduciendo la recarga de acuíferos). Existen otras fuentes 
de agua alternativa como: el reciclamiento de aguas residuales, la 
desalinización de agua del mar o el aprovechamiento de la neblina, 
este último conocido como “cosecha de neblina”. Las dos primeras 
alternativas, aunque resulten en fuentes prácticamente ilimitadas 
de agua, su potabilización requiere de una cantidad considerable de 
energía, y actualmente se utiliza combustibles fósiles en su mayoría 
[28]; motivo por el cual estos sistemas no podrían ser considerados 
como sustentables. La cosecha de neblina, podría resultar en una 
fuente de agua sustentable, el equipamiento y mantenimiento es 
sencillo y relativamente barato. Este sistema se lo ha utilizado en 
pequeñas comunidades con resultados satisfactorios [15], [31], 
[32]. El problema de la cosecha de agua es que está limitado a zonas 
expuestas a neblina y que la cantidad potencial de agua recolectada 
por este sistema es desconocida hasta cierto punto. 

La neblina consiste en pequeñas gotas de agua que se encuen- 
tran en suspensión debido a que su tamaño no es lo suficientemente 
grande para que su velocidad de caída supere la velocidad de empu- 
je del aire [33], permitiéndolas precipitarse. La neblina se puede 
formar por diversos procesos físicos en la atmósfera [34], [35], pero 
en general ocurre debido a la condensación de la evaporación de la 
humedad del suelo, vegetación, de masas de agua o de masas de 
aire húmedas. Cuando la neblina es llevada por el viento, las peque- 
ñas gotas de agua chocan con la estructura de la vegetación, estas 
coalescen formando gotas más grandes que finalmente se precipitan 
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en el suelo [33], [34], [36]. A este proceso se conoce como inter- 
cepción de neblina, y puede ser una fuente importante de agua para 
varios ecosistemas, alcanzando valores entre 4 y 98% del aporte de 
la precipitación [37]-[43]. 

Los habitantes de regiones con escasez de fuentes de agua 
convencionales han tratado de aprovechar este proceso hidrológico 
como una fuente de agua alternativa, al utilizar colectores para 
captar neblina. Existen varios proyectos de sistemas de colección 
de neblina alrededor del mundo (Chile, Ecuador, Sudáfrica, Nami- 
bia, Omán, Arabia Saudita, España). De acuerdo a la literatura, la 
producción de diferentes colectores de neblina oscila entre 2 y 10 
1/m*día en promedio [15], [31], [51], [52], [32], [44]-[50], alcan- 
zando valores de hasta 300 1/m*-día [45]. De acuerdo a Batisha, 
2007 [15], la implementación de estos sistemas puede resultar atra- 
yente debido a que se puede colectar una gran cantidad de agua, 
su costo es relativamente bajo o comparable con otros sistemas 
de agua, los colectores son simples y no requieren energía exter- 
na, y porque el agua captada se espera que sea de buena calidad. 
Sin embargo, la factibilidad de este sistema depende de un factor 
importante como es la cantidad de neblina captable. Antes de la 
implementación de este tipo de sistema se debe realizar una inves- 
tigación sobre la cuantificación de neblina en el sitio con diferentes 
colectores de neblina y que incluya el monitoreo de otras variables 
meteorológicas que permitan conocer las condiciones que favorecen 
la intercepción de neblina. Debido a que estos sistemas captan tanto 
lluvia como neblina, sería también importante separar estas compo- 
nentes para evaluar realmente el aporte de la neblina. 

Conociendo la problemática del incremento de la demanda de 
agua, uno de los componentes que se tiene que trabajar alrededor de 
una ciudad inteligente es el manejo y aprovechamiento de los recur- 
sos hídricos. Sin duda alguna, los sistemas de aprovechamiento de 
agua deberían ser sustentables, con tecnologías que sean amigables 
con el ambiente y que incluya la participación de la población. Uno de 
estos sistemas puede ser la captación de neblina. En este trabajo pre- 
sentamos una metodología simple para evaluar la cantidad de neblina 
recolectada por un sistema de captación de neblina, determinando no 
solamente la cantidad de neblina captada sino también identificando 
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los factores que afectan su captación. Este trabajo se estructura de 
la siguiente manera: primero, se presenta la metodología y equipa- 
miento para realizar esta evaluación, luego, se propone un caso de 
estudio en la isla San Cristóbal (Galápagos), expuesta a la presencia 
de neblina y con problemas de escasez de agua para su sostenibilidad. 
A continuación, los resultados del caso de estudio son presentados y 
discutidos. Finalmente las conclusiones del trabajo son presentadas. 


2. Metodología 


A. Intercepción de neblina y ubicación geográfica 


Existen básicamente tres factores que afectan la intercepción 
de neblina [33], [531], [54] la ubicación geográfica, diseño del 
colector y factores climáticos. Mientras las gotas de lluvia tienen un 
diámetro de 0.5 a 5 mm, las gotas de agua en la neblina tiene un 
diámetro de 1 um a 40 um [32], [35]. Este pequeño tamaño es el 
motivo por el cual estas gotas no pueden precipitarse, y por ende flo- 
tan sobre la superficie del suelo como niebla, neblina o bruma. Del 
punto de vista meteorológico, la diferencia entre estos tres últimos 
nombres radica básicamente en el rango de visibilidad que permiten 
(ej. la variable climática que reduce la visibilidad a una distancia 
menor a 1000 m se considera como niebla). Para el punto práctico 
de este estudio, dicha diferenciación no es relevante, y por lo tanto 
a la niebla y bruma se los considerará como neblina. La intercepción 
de neblina ocurre cuando las pequeñas gotas de agua que confor- 
man la neblina son acarreadas por el viento y chocan contra una 
superficie, que se satura y permite su precipitación. 

La ubicación geográfica es un factor clave para la implementa- 
ción de un sistema de cosecha de neblina, ya que no todas las regio- 
nes están expuestas a la presencia de neblina. Las regiones costeras 
serían las mayormente favorecidas por este sistema, ya que están 
propensas a la neblina de advección, producto de la condensación 
de las masas de aire caliente y cargadas de humedad, provenientes 
del mar, cuando pasan por el suelo frío. Este tipo de neblina puede 
estar presente varios cientos de kms hacia la superficie continental, 
es por este motivo que varias regiones áridas (ej. desierto de Ataca- 
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ma, desierto del Sahara, Golfo Pérsico) están expuestas a neblina. 
Las regiones montañosas también son propensas a la presencia de 
neblina, debido a que las montañas representan un obstáculo en el 
movimiento de las masas de aire húmedo, obligándolas a elevarse 
por sus laderas y condensándose debido a enfriamiento adiabático. 
También, en regiones con clima templado, la neblina se puede for- 
mar debido a la condensación del aire húmedo caliente durante el 
día por el enfriamiento del suelo en la noche. 


B. Dispositivos de colección de neblina 


Existen dos alternativas para realizar la cosecha de neblina, 
puede ser tanto la intercepción de forma natural como de forma 
artificial. La intercepción de forma natural ocurre cuando el dosel 
de la vegetación (hojas y ramas que conforman su estructura) inter- 
cepta la neblina permitiendo el goteo del dosel hacia el suelo. En 
este caso, la colección se hace bajo la vegetación de forma directa. 
Este método se ha utilizado en sitios como en las Islas Canarias [55] 
y Omán [45], siendo ésta, la única fuente de agua tanto para sus 
habitantes como para animales [32]. Para este caso, la intercepción 
de la neblina va a depender de la estructura de la vegetación, de la 
forma de sus hojas y orientación respecto al viento. La cosecha de 
neblina implicaría la implementación de cisternas de recolección 
bajo la vegetación, lo cual puede ser complicado. También, las cis- 
ternas requerirían de un constante mantenimiento (para limpiar su 
superficie de ramas y hojas) y la infraestructura podría suponer una 
afectación al ecosistema (en el caso de bosques). La otra alternativa, 
es el uso de estructuras artificiales para captar neblina, como son los 
captadores de neblina. Los captadores tienen una malla que inter- 
cepta las pequeñas gotas de neblina a medida que el aire atraviesa 
la misma. Las gotas captadas en la malla se unen formando gotas 
más grandes que se escurren por la malla hacia una canaleta que 
conduce el agua a un tanque de almacenamiento. 

Existen diferentes tipos de captadores de neblina, los cuales 
dependen de su estructura y tipo de malla. En cuanto a la estructura 
existen básicamente dos tipos: i) dispositivos cilíndricos (usado en 
Hawaii [56], Tenerife [52] y Costa Rica [57]), cuya malla constituye 
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la superficie de un cilindro, y el cual está conectado a un embudo 
que recoge la neblina captada, y 1i) dispositivos bidimensionales 
(usado en Chile, España, Nepal, Sudáfrica y Australia [15], [39], 
[451), que consiste en una superficie plana de malla ubicada per- 
pendicularmente a la dirección del viento. 

Los dispositivos cilíndricos tienen la ventaja de no ser depen- 
dientes de la dirección del viento, la desventaja es que no se pueden 
construir superficies muy grandes. Los dispositivos bidimensionales 
se pueden construir en varios tamaños dependiendo de las necesida- 
des, no ocupan mucho espacio, son relativamente baratos y fáciles 
de instalar. 

Sin embargo, tienen como desventaja que cuando existen 
vientos muy fuertes pueden ser desestabilizados o su malla puede 
romperse. Existen otro tipo de colectores menos usados, como: 
colector macrodiamante [58], atrapaniebla DISDERA [59], tipo 
Juvik [56], colector Eiffel [60] y two-stage tunnel tipo Daube [57]. 
Otra característica importante de los colectores de neblina es su tipo 
de malla. Tanto el material como su diseño influyen directamente 
en la eficiencia del colector. Un material común para las mallas es 
el acero, ya sea de aluminio [56], [57] o de acero inoxidable [15] 
con un diseño de pantalla de persiana o entrelazada con material 
de poliester. Este material ha sido probado efectivo durante eventos 
únicamente de neblina y eventos de lluvia y neblina con vientos 
fuertes [57]. 

Otro material utilizado tanto en colectores cilíndricos como en 
bidimensionales es el wire harp screen, que consiste en una red de 
hilos de nylon con un diámetro de 0.8 mm espaciados 2 mm [57], 
[61]. La desventaja de este material es su pérdida de eficiencia en 
eventos con fuertes vientos. El material mayormente utilizado es la 
red de sombra Raschel [15], que es de polipropileno y cuyo diáme- 
tro de fibra es efectivo para capturar la neblina. Además, el tejido 
consiste en triángulos estirados que beneficia el desplazamiento 
vertical por gravedad de las gotas que chocan contra ella [15], [45]. 
Uno de los colectores más usados alrededor del mundo (alrededor 
de 40 países [15]), es el "standard fog collector" (SFC) o colector de 
neblina estándar, propuesto por Schemenauer y Cereda 1994 [45]. 
Este colector consiste en un panel de red de sombra Raschel con 
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una superficie de recolección de 1m*, que está sostenido por una 
estructura en forma de marco a 2 m de elevación perpendicular a la 
dirección del viento. 

La elección del tipo de colector de neblina va a depender de 
las condiciones del sitio, facilidad de construcción y su precio. Para 
el caso de la evaluación de la prefactibilidad de este sistema, se 
recomienda utilizar al menos dos colectores de diferentes materia- 
les. Materiales conocidos y usados en otros sitios pueden servir para 
realizar comparaciones sobre la capacidad de colección de neblina 
del sitio de estudio y hacer predicciones previas sobre el potencial de 
captura a largo plazo en base a estas comparaciones. En el caso de 
que no se conozca las condiciones climáticas previas a la instalación 
de los colectores (en especial la velocidad y dirección del viento), se 
recomienda fuertemente el uso de al menos un colector cilíndrico. 
Aunque la cuantificación de la captura de neblina se podría realizar 
a nivel diario de forma manual, sería preferible realizar mediciones 
automáticas a un menor paso de tiempo para realizar comparacio- 
nes con otras variables meteorológicas. 


C. Influencia de factores climáticos 


Es importante identificar los factores climáticos que afectan la 
neblina. De acuerdo a la literatura, los principales factores que afec- 
tan la intercepción de neblina son el contenido de agua en el aire, 
el tamaño de las gotas y la velocidad del viento. Los dos primeros 
factores tienen relación con las propiedades de la neblina, mientras 
la velocidad del viento es un factor climático. La dirección del vien- 
to también puede ser un factor preponderante, la elección de usar 
un colector cilíndrico o bidimensional depende de esta variable. La 
lluvia es otro factor importante, sobre todo en regiones en donde 
existen precipitaciones del tipo orográficas, en donde las mismas 
están acompañadas de neblina. Además del viento y la lluvia, la 
temperatura, radiación solar y humedad relativa son otras variables 
meteorológicas que pueden afectar a la intercepción de neblina. 

La implementación de una estación meteorológica en el sitio 
donde se planea evaluar la intercepción de neblina es fundamental. 
Se debe tratar que la estación mida al menos las principales variables 
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meteorológicas mientras se hace la cuantificación de la intercepción 
de neblina. El monitoreo de otras variables como la visibilidad y la 
distribución del tamaño de partículas de agua en suspensión sería 
un valor agregado, dado que se podría determinar el contenido de 
agua en el aire a partir de estos datos [62]. 

Para cuantificar el efecto de las variables meteorológicas en 
la intercepción de neblina se puede utilizar el coeficiente de corre- 
lación, r(x y). Aunque simple, el coeficiente de correlación además 
de reflejar la relación entre dos variables indica también el efecto 
multiplicador o reductor de la variable independiente sobre la 
dependiente. Otra forma de cuantificar este efecto es un análisis de 
cuantía, en donde se pueda determinar la importancia relativa de 
cada una de las variables climáticas en la recolección de neblina. 
Este análisis parte de la asunción de un modelo lineal múltiple, en 
donde existe una variable independiente que es función de variables 
independientes o predictores: 


Y = Ap + 044X1 + 09X) + ** + GnXn (1), 


donde y es la variable dependiente, x1,2,..n son los predictores 
y al,2,....n son los parámetros de regresión. De acuerdo a la teoría 
de propagación de errores, el error de una variable en función de 
varias viene dado por la expresión: 


E) = Ela |z9| 000) 0) 


donde n es el número de predictores, e(y) y e(x,) son los 
errores de la variable dependiente y de los predictores, respectiva- 
mente. Para el caso de medidas directas (como las variables meteo- 
rológicas), el error de los predictores puede estar descrito por su 
desviación estándar (Sx,). Usando la ecuación (1) como función en 
la ecuación (2), y resolviendo la ecuación (2), el error de la variable 
dependiente viene dado por: 


E(y) = 4,Sx, + a,8x, + *** + 4,SXn (3). 


Finalmente, si se normaliza el error de la variable indepen- 
diente, se puede obtener la contribución relativa al error de cada 
una de las variables independientes (Px.): 
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aiSXx;i 
Px; = =—— U 


Para el caso del análisis de la intercepción de neblina, la varia- 
ble dependiente corresponde a la intercepción de neblina, las varia- 
bles independientes o predictores corresponden a las variables meteo- 
rológicas, y la contribución relativa al error de la variable dependiente 
de cada predictor se podría interpretar como el efecto relativo de cada 
variable meteorológica sobre la intercepción de neblina. 


D. Separación de neblina y lluvia en el colector 


Usualmente los diferentes dispositivos de colección de neblina 
atrapan tanto la neblina como la lluvia. En este caso no se tiene una 
medida del aporte real de la intercepción de neblina, una medida 
que es fundamental para la evaluación de la implementación de un 
sistema de recolección de neblina. En varios estudios [52], [56], 
[63], se utiliza una protección en la parte superior del colector para 
evitar la entrada de precipitación y medir únicamente la neblina. Sin 
embargo, los objetivos de estos estudios es la medición únicamen- 
te de la neblina y no el estudio de la factibilidad de un sistema de 
colección de neblina como es el caso de esta investigación. 

La cuantificación de neblina es necesaria, por lo que una alter- 
nativa sería que además de los colectores de neblina se instale un dis- 
positivo para realizar la medición únicamente de la neblina. Se debería 
considerar que el uso de un protector de lluvia en el dispositivo de 
colección de neblina, podría causar un efecto aerodinámico, alterando 
la dirección e intensidad del viento y por ende, afectando la estimación 
de neblina. Otra alternativa es realizar una separación de los aportes de 
neblina y lluvia en los colectores. Esta separación resulta ser una medi- 
da más directa del aporte de neblina ya que se la realiza directamente 
sobre el colector que se estaría evaluando y no indirectamente de otro 
dispositivo en donde se mide únicamente la neblina. 

Para realizar la separación de neblina se puede utilizar un 
modelo geométrico sencillo. Domínguez et al. (2017) [43] utilizó 
este modelo para separar la neblina de la lluvia en un colector cilín- 
drico, al determinar primero el valor del volumen real de precipita- 


Evaluación de la cosecha de neblina como una fuente potencial para el aprovechamiento de agua 


ción captado por el colector de neblina, y calculando el volumen de 
neblina, como la diferencia entre el volumen medido por el colector 
y el volumen real de la lluvia (Figura 1). 


RF. 


Pluviómetro 


Colector 
Cilíndrico 









Colector 
Bidimensional *> 


Ns 


Figura 1. Área proyectada de un pluviómetro, colector cilíndrico y un 
colector bidimensional, perpendicular a la dirección de la precipitación 


Christian Domínguez, Paola Echeverría, Marcos Villacís, y Sophie Violette 


Esta metodología se basa en que la intensidad y dirección de 
la lluvia captada por un pluviómetro normal y el colector de neblina 
es la misma en ambos dispositivos. Esto puede ocurrir, si ambos dis- 
positivos están ubicados cerca el uno del otro. También, es necesario 
asumir que la intercepción de neblina se produce sobre la proyec- 
ción perpendicular a la dirección del viento de la malla del colector. 
En este caso, se necesitaría un medidor de velocidad y dirección 
del viento tridimensional. En el caso de tener un medidor estándar 
de la dirección del viento (únicamente mide la dirección horizontal 
del viento), la componente vertical de la dirección se podría asu- 
mir igual a la pendiente del terreno o de forma horizontal. Para 
casos de topografía sencilla y pendientes suaves se podría asumir 
una componente horizontal del viento. Pero en casos de topografía 
complicada o de pendientes fuertes se debería optar por la medición 
tridimensional o el uso de la pendiente del terreno, respectivamente. 
El modelo se describe a continuación. 

Ante la existencia de viento (condición necesaria para que 
exista intercepción de neblina), el pluviómetro mide la compo- 
nente vertical de la lluvia (RF) que viene dado de una relación 
trigonométrica: 


RF, = RF,X cos y (5), 


donde (RF) es la magnitud de la lluvia real que tiene una 
inclinación (angulo). El ángulo de inclinación de la lluvia se calcula 
a partir de la intensidad de la precipitación, el tamaño y velocidad 
terminal de caída de las gotas de lluvia, y de la velocidad del viento 
[40], [43]. La intensidad de la lluvia corresponde a la medición del 
pluviómetro directamente. El tamaño promedio del diámetro de una 
gota de lluvia (D) en mm puede ser calcula con [40], [43]: 


RI = 2.23x(0.03937XREF,)"102 (6), 


donde RI es la intensidad de la lluvia en mm/h. La velocidad 
de caída de la gota (U) viene dado directamente de su diámetro 
[40], [43], [64]: 


V = 3.378x In(RI) + 4.213 (7), 
y el ángulo de caída se calcula con [40], [43], [65]: 
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tamy = 26) 


donde V es la velocidad del viento. 

A partir de la ecuación (5) se puede determinar la magnitud de la llu- 
via real, la cual es equivalente al volumen de lluvia real dividido para la pro- 
yección de la superficie circular horizontal del pluviómetro perpendicular a 
la dirección de RF. Realizando la misma equivalencia, el volumen captado 
por el colector de neblina correspondiente a la lluvia real (VR) es [43]: 


VR, = RE,XS, (9), 





donde Ses la proyección de la superficie del colector perpendicular 
a la dirección de RF. Finalmente, la magnitud de la intercepción de nebli- 
na captada por el colector (NI) está dada por [43]: 


(10), 


_ (VF¿-fexVRa) 
Sy 


NI 


donde S, es la proyección de la superficie del colector perpen- 
dicular a la dirección del viento y es un coeficiente de corrección 
aplicado a la medición de la lluvia en el colector [43]. 

La dificultad de este método resulta en la obtención de las 
superficies proyectadas del colector de neblina, ya que va a depender 
de la dirección del viento y del ángulo de caída de la precipitación 
para cada paso de tiempo. En el caso de un colector bidimensional o 
cilíndrico, esta estimación no resulta difícil debido a que su geometría 
es relativamente sencilla, pero en el caso de geometrías complicadas 
(caso del colector tridimensional o colector con secciones complemen- 
tarias) la estimación de esta superficie puede ser bastante desafiante. 


3. Caso de estudio (San Cristóbal, Galápagos) 


A. Área de estudio 
1) Ubicación geográfica y clima 


El Archipiélago de Galápagos está ubicado a 1000 km al oeste 
del Ecuador continental. La isla San Cristóbal se ubica al lado este 
del Archipiélago. La isla tiene una superficie de 558 km?, donde más 
del 80% de su área está protegida por el Parque Nacional Galápagos. 
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La población total de la isla es de aproximadamente 7500 habitantes 
[66], donde la mayor concentración de la población está en Puerto 
Baquerizo Moreno. Las condiciones climáticas de Galápagos están 
influenciadas por la interacción de la corriente oceánica de Humbol- 
dt y los vientos alisios [67], [68]. Los vientos alisios, con dirección 
Sudeste, se condensan en las pendientes del barlovento de las islas 
principales generando una diferencia clara entre el lado húmedo bar- 
lovento y el lado seco sotavento de las islas. La migración interanual 
de la zona de convergencia intertropical da lugar a la aparición de dos 
temporadas climáticas, la fría de “garúa” y la cálida de “invierno”. La 
temporada de garúa, ocurre entre junio y diciembre, y se caracteriza 
por la presencia de temperaturas relativamente bajas tanto del aire 
como de la superficie del océano [68]. Las precipitaciones son del 
tipo orográficas, de larga duración, baja intensidad y localizadas en 
el lado barlovento de las islas [68]. Durante esta época, una capa de 
inversión térmica se forma en la parte alta de las islas, dificultando el 
paso de las masas de aire húmedo y conduciendo de esta manera a la 
formación de neblina en las partes altas de las islas [69] La presencia 
de neblina es casi permanente durante esta época. Por otra parte, 
la temporada de invierno, ocurre de enero a mayo, y se caracteriza 
por la existencia de temperaturas relativamente altas en el aire y la 
superficie del océano. En esta época, ocurren precipitaciones del tipo 
convectivo, de corta duración y alta intensidad [68], [70], [711]. 


2) Geología y recursos hídricos 


Las islas Galápagos, formadas de rocas basálticas mixtas [72]- 
[75], emergen de un punto caliente en una plataforma submarina 
poco profunda que forma la parte occidental de la cordillera Carnegie 
Ridge, en la placa de Nazca [75]. Pero la presencia de una cresta 
segmentada en el océano Centro de Propagación de Galápagos (GSC) 
no se puede ignorar, ya que afecta la estructura y organización de las 
islas. La isla San Cristóbal está formada por la erupción de flujos de 
lava pahoehoe y aa' [72] intercalado por periodos de calma, en donde 
debido a la condiciones húmedas en el clima, capas de suelo se desa- 
rrollaron debido a la meteorización [75]. Por este motivo, la estructu- 
ra interna de la isla posee un sistema multicapas entre flujos de lava 
y paleo-suelos. Al final de la actividad volcánica, la isla fue cubierta 
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por una capa de depósitos de piroclastos de al menos 10 m [72], que 
debido a la meteorización se formó un suelo en la superficie. 

En el lado barlovento de la isla, las condiciones húmedas 
y la presencia de suelo favorecieron la escorrentía promoviendo 
la erosión. Por este motivo se puede observar una red de drenaje 
desarrollado que tiene incisiones profundas en varios sectores. La 
hidrología es compleja en este lado de la isla, en la parte alta existen 
praderas con pendientes suaves que favorecen el encharcamiento de 
agua, como es el caso de la laguna “El Junco”. A media elevación, 
se puede observar varias encañadas. Algunas secas y otras con agua 
permanente que nacen de fuentes que están siendo alimentadas por 
un acuífero colgado formado sobre una capa de baja permeabilidad 
que no permite la percolación del agua infiltrada a fondo [74]-[77]. 
El caudal de la mayoría de encañadas es menor a 5 l/s [78]. En 
la parte costera, el agua de las encañadas se vuelve a reinfiltrar, y 
solamente cuatro encañadas llegan a descargarse en el océano en la 
bahía de agua dulce [79]. 

Galápagos se caracterizan por la falta de agua en sus islas. 
La única isla con fuentes de agua dulce permanente es la isla San 
Cristóbal. El suministro de agua para la población es captado de 
dos encañadas, “La Toma” y “Cerro Gato”, proporcionando alre- 
dedor de 30 l/s para la población de Puerto Baquerizo Moreno. 
Aunque actualmente las necesidades de agua para uso doméstico 
están satisfechas (aparentemente), existe un déficit importante en 
cuanto al riego. En el 2010, existió un déficit de 20.5% equivalente 
a 1.8 hm* [80], y se estima que este déficit se incremente a 7.1 hm?* 
(80.1%) para el 2035 [81]. Este problema es aún mayor en otras 
islas poblados donde no existe fuentes de agua dulce permanente. 
Para garantizar las sostenibilidad de las poblaciones en estas islas, 
es necesario encontrar fuentes alternativas de agua, como es el caso 
de la cosecha de neblina. 


B. Implementación de la metodología 


1) Sitio de estudio 


El sitio de estudio está ubicado en la parte alta del lado sur 
barlovento de la isla San Cristóbal, a 600 m.s.n.m (Figura 2). 


Christian Domínguez, Paola Echeverría, Marcos Villacís, y Sophie Violette 


Línea Topográfica (100 m) 
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Figura 2. Ubicación del sitio de estudio en el lado barlovento de la Isla 


San Cristóbal (Galápagos) 


Este sitio está dentro del área agrícola de la isla que se extiende 
desde la parte a media elevación de la isla (aproximadamente a 200 
m.s.n.m) hasta la cumbre de la misma. En los alrededores del sitio, 
el suelo está cubierto por pasto y por bosques de Miconia Robinsonia- 
na, una especie endémica de Galápagos. "Toda esta zona (desde 300 
m.s.n.m) está expuesta a la presencia de neblina alrededor de seis 
meses al año durante la época de garúa, por lo que representa un sitio 
ideal para evaluar y cuantificar la intercepción de neblina. 


2) Monitoreo climático 


Para realizar el monitoreo de las principales variables meteoroló- 
gicas se utilizó una estación climática (Tabla 1). 


Tabla 1. Equipos de la estación climática a 600 m.s.n.m. en 


San Cristóbal (Galápagos) 


Datalogger* (x2) Campbell CR1000 


TES25MM 
Pluviómetro* (42) R307A0 
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Modelo 
Campbell ARGI00 


Sensor de temperatura y hume- Campbell 0215 
dad relativa 


03002-5 
Campbell CS300 


a. Registrador de datos. 

b. Usado para la medición de la precipitación. 

c. Pluviómetro modificado para la medición de la intercepción de neblina en los colectores 
estándar (SFC35 y SFC5O). 

d. Pluviómetro modificado para la medición de la intercepción de neblina en el colector 
cilíndrico (CFC). 





La precipitación se midió con un pluviómetro Texas TTE525MM 
ubicado a 1.5 m del suelo. La dirección y velocidad del viento se moni- 
toreó a 2 m sobre el nivel del suelo con un sensor Young WindSentry 
Kit. La radición solar se midió con un piranómetro de silicona Kippé:- 
Zonen SPLite a 2 m del suelo. La humedad relativa y temperatura se 
monitorearon con un sensor Campbell CS215 a 2 m sobre el suelo. 
Todos los datos de estas variables se grabaron en un datalogger Cam- 
pbell CR1000, que permite realizar mediciones cada minuto y registra 
los datos cada 15 minutos. 

La intercepción de neblina se midió utilizando tres colectores 
(Figura 3). 
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Figura 3. Esquema de monitoreo meteorológico y de intercepción de 
neblina. La estación meteorológica cuenta con un pluviómetro (1.5 m sobre 
el suelo), un anemómetro (2 m sobre el suelo), un sensor de temperatura y 
humedad relativa (2 m sobre el suelo), un piranómetro (2 m sobre el suelo) 
y tres colectores de neblina conectados a basculadores automáticos 


Christian Domínguez, Paola Echeverría, Marcos Villacís, y Sophie Violette 


El primero, es un colector cilíndrico (CFC), con una altura de 
40 cm y 12 cm de diámetro, que tiene una estructura metálica cubier- 
ta por una malla plástica de 1 mm de apertura y un coeficiente de 
sombra del 72% (estimado a partir de análisis de imágenes). El agua 
interceptada por la malla se drena en un embudo en la parte inferior 
del colector, el cual está conectado a una manguera que dirige el agua 
hacia un sistema de basculación automático, el cual permite la medi- 
ción del volumen de agua interceptado por el colector. Los otros dos 
dispositivos de medición de neblina, fueron los conocidos colectores 
estándar de neblina ubicados a 2 m sobre el nivel del suelo, con una 
superficie de colección de 1x1 m, y que tienen el mismo diseño pero 
difieren en la malla utilizada. Los colectores fueron construidos con 
malla de polietileno, de 35% de coeficiente de sombra en el primero 
(SFC35), mientras que el segundo colector tiene una malla de 50% de 
coeficiente de sombra (SFC50). La estructura de soporte de colector 
fue construida con tuberías de PVC, que resultó ser un material rela- 
tivamente barato, de fácil transporte y que no afectó la sensibilidad 
del ecosistema de Galápagos. Estos colectores tienen una canaleta de 
recolección conectada a una manguera que dirige el agua captada por 
los colectores a sistemas de basculación automáticos individualmente. 
Los datos de los tres colectores fueron grabados por otro datalogger 
CR1000 que registra los datos de forma simultánea con los datos del 
resto de variables meteorológicas. 


3) Aplicación de la metodología 


La evaluación de la intercepción de neblina se realizó en los 
meses de junio y julio del año 2016, al inicio de la temporada de 
garúa. La cuantificación del rendimiento de los colectores para 
captar agua se lo realizó de dos maneras: i) con el volumen acu- 
mulado directamente medido por los colectores en 1/m2-día, y ii) 
utilizando el modelo geométrico de separación entre intercepción 
de neblina y la lluvia a nivel horario, en mm. Para poder utilizar el 
modelo, se estimó el área proyectada de los colectores en el plano 
perpendicular a la dirección de la lluvia a nivel horario, en mm. 
Para poder utilizar el modelo, se estimó el área proyectada de los 
colectores en el plano perpendicular a la dirección de la lluvia (S_r) 
para cada paso de tiempo. En el caso del colector cilíndrico, S_r se 
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calculó en la forma descrita en Dominguez et al., 2017 [43], y para 
el caso de los SFCs, se utilizaron varias relaciones geométricas. Para 
todos los dispositivos, se asumió que el área de intercepción de pro- 
yección perpendicular a la dirección del viento es perpendicular a 
la pendiente del terreno. S_ fue estimado con las mismas relaciones 
trigonométricas utilizadas para obtener $, y es un valor constante 
para todo el periodo de estudio. El factor fe, correspondiente para 
la corrección de medición de la precipitación se estimó usando la 
metodología descrita en Domínguez et al., 2017 [43]. 

El análisis estadístico se realizó utilizando un filtro, primero los 
registros se discretizaron a datos horarios, usando la media o sumatoria 
de los datos cada 15 minutos. Luego, se utilizaron únicamente los datos 
en que existió un registro de intercepción de neblina diferente de O, de 
esta manera se evalúa únicamente la relación entre las variables meteo- 
rológicas con la intercepción de neblina, cuando ésta ocurre. 


4. Resultados 


A. Condiciones climáticas durante el periodo de estudio 


A partir de los datos históricos de la estación operada por 
la Fundación Charles Darwin en la costa de Santa Cruz, se puede 
observar que durante el periodo de estudio (junio y julio de 2016), 
la precipitación acumulada es de 26.5 mm y la temperatura media 
del aire es de 23.3 *C, que comparado, con los valores promedio de 
la estación (44.7 mm para la precipitación y 23.3 *C para la tempe- 
ratura), resultan condiciones secas en términos de precipitación y 
condiciones normales en términos de temperatura. 

Durante los meses de junio y julio de 2016 en el sitio de estudio 
la estación meteorológica registró las principales variables meteoro- 
lógicas. Un resumen de esta información se presenta en la Tabla 2. 


Tabla 2. Resumen de los valores diarios de las principales variables 
meteorológicas registras en el sitio de estudio 


Precipitación? [mm] 72.0 (23.9) 
Temperatura? [9C] 18.2 (15.5 a 24.0) 
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Radiación solar" [W/m?] 211 (56 a 318) 


Humedad relativa! [%] 99 (67) 
Velocidad del viento* [m/s] 2510131) 
Dirección del viento* [9] 199 (187 a 217) 


a. Precipitación acumulada en todo el período corregida en función del ángulo de caída. En 
paréntesis, la precipitación máxima diaria registrada. 

b. Temperatura media diaria. En paréntesis, el valor mínimo y máximo registrado. 

C. Radiación solar media diaria durante las horas de sol. En paréntesis, el valor del primer y 
tercer cuartil. 

d. Humedad relativa media diaria. En paréntesis, el porcentaje del tiempo que la humedad 
relativa fue mayor o igual a 99%. 

e. Variable media diaria. En paréntesis, el valor del primer y tercer cuartil de la variable. 





La precipitación registrada alcanzó un valor de 72 mm y la 
temperatura media fue de 18.2 *C. Estos valores resultan bajos com- 
parando con los registros Junio y Julio del 2013 al 2016 en el mismo 
sitio (286.2 mm y 19.1 *C para la precipitación y temperatura, respec- 
tivamente). La velocidad y dirección media y diaria del viento fue de 
2.5 m/s y 199%, respectivamente. La dirección del viento es similar a 
años pasados (1935), pero en el caso de la velocidad del viento, este 
valor está por debajo de los registrados en años pasados (2.9 m/s). La 
radiación solar media diaria durante las horas de sol permaneció rela- 
tivamente baja durante todo el periodo (211 W/m) y es ligeramente 
mayor que la presentada en años pasados (202 W/m). Similar a años 
pasados, la humedad relativa estuvo cerca o igual a condiciones de 
saturación. La humedad relativa estuvo por encima del 95% en todo 
el periodo y durante el 67% del tiempo, ésta fue mayor al 99%. 


B. Cuantificación de la intercepción de neblina y comparación 
entre colectores 


Durante el periodo de estudio, el volumen total colectado por 
el colector de neblina CFC, SFC35 Y SFC50 fue de 26, 337 y 410 l, 
respectivamente. Estos valores representan un rendimiento diario 
de 3.8 1/m”-día para el colector CFC, 7.0 1/m“día para el colector 
SFC35 y 8.5 1/m”“-día para el colector SFC50 (Tabla 3). 
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Tabla 3. Rendimiento e intensidad de intercepción de neblina de los tres 
colectores estudiados 


Rendimiento” [1/m*edía] 3.8 (0.6 a 4.9) 7.0 (2.0 a 10.0) 8.5 (2.2 a 12.1) 





a. Volumen de neblina y precipitación captada por el colector. 

b. Altura de neblina captada por el colector como resultado del modelo geométrico de 
separación entre neblina y precipitación. 

Los valores presentados entre paréntesis corresponden al primer y tercer cuartil de la variable. 


El mayor volumen colectado a un nivel diario se registró en el 
colector SEC50O, con un valor de 44.6 1/m“día. En todos los casos se 
logró colectar al menos 1 1/m*-día durante el 77% del tiempo, y en 
el colector SFC50 durante el 88% del tiempo. 

Se usó el modelo geométrico descrito anteriormente para sepa- 
rar la neblina de la precipitación. Los resultados del modelo muestran 
que la altura de intercepción de neblina durante el periodo de estudio 
fue de 176.5 mm, 195.8 mm y 230.6 mm en el colector CFC, SFC35 
y SFC5O, respectivamente. Estos valores representan una intensidad 
de intercepción de neblina media de 3.7 mm/día en el colector CFC, 
4.1 mm/día en el colector SFC35 y 4.8 mm/día en el colector SFC5O. 
La altura de intercepción de neblina presentó un alto porcentaje res- 
pecto a la precipitación, alcanzando el 245%, el 272% y el 320% de 
la precipitación en el colector CFC, SFC35 y SFC5O, respectivamente. 

Analizando los valores de intercepción de neblina a nivel diario, 
se realizó una correlación entre los volúmenes captados por los colecto- 
res, y también entre la altura de agua captado por los colectores (resul- 
tados del modelo). La correlación entre los tres colectores, tanto para 
el volumen como para la altura, es alta en todos los casos (Tabla 4). 


Tabla 4. Correlación entre los colectores 





Los valores con fondo blanco y gris representan el factor de correlación del volumen de 
neblina y precipitación captada entre colectores y la altura de neblina captada (resultado del 
modelo geométrico) entre colectores, respectivamente. 
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Los colectores estándar (SFC) presentan una mayor correla- 
ción entre sí que la que se presenta con el colector cilíndrico, sobre 
todo en el caso de la altura de neblina. 


C. Influencia de las variables meteorológicas en la intercepción 
de neblina 


Se realizó un análisis sobre la influencia de las variables 
meteorológicas en la intercepción de neblina de los colectores. En 
la Tabla 5 se muestra la correlación existente entre las variables 
meteorológicas y la intercepción de neblina en cada colector. La 
correlación es pobre para todos los casos. La variable que presenta 
mayor correlación con los tres colectores es la velocidad del viento 
(0.47 a 0.55). En el caso del colector CFC, la correlación con la pre- 
cipitación también presenta un valor relativamente alto. En el caso 
de los colectores SCE la otra variable que presenta una correlación 
relativamente alta es la radiación solar, aunque en este caso las 
correlaciones son negativas mostrando que esta variable tendría un 
efecto reductor en la intercepción de neblina. Para estos colectores 
(SFC), la correlación con la precipitación también es negativa, aun- 
que la correlación es baja (-0.04 a -0.01). 


Tabla 5. Correlación entre las variables meteorológicas y la intercepción 
de neblina en los colectores 


ute meta | ere 
indio 


Humedad relativa ; 


0.05 (-0.03) -0.18 (-0.29) -0.07 (-0.19) 


a. El valor entre paréntesis corresponde a la correlación entre la radiación solar y la 
intercepción de neblina únicamente durante las horas de sol 





El análisis de cuantía se utilizó para determinar la influencia 
relativa de cada variable meteorológica en la variabilidad de la 
intercepción de neblina. Los resultados se muestran en la Tabla 6. 
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Tabla 6. Contribución relativa de las variables meteorológicas en la 
variabilidad de la intercepción de neblina en los colectores 


Variable PEA UE 


Los valores de la contribución de cada variable en la intercepción de neblina se presentan 
como porcentaje. 





Las variables que mayor influencian tienen en la intercepción 
de neblina son la velocidad del viento, radiación solar y la precipita- 
ción. La velocidad del viento es la variable que mayor influencia tie- 
ne en la intercepción de neblina de los tres colectores, con una con- 
tribución aproximada del 50%. En los colectores estándar, se puede 
apreciar que la radiación solar tiene una contribución importante, 
sobre todo en el colector SFC35, alcanzando un valor del 33%. En 
estos colectores, la precipitación podría ser considerados como un 
factor influyente en menor medida, alcanzando un valor del aproxi- 
mado del 10%. A diferencia de los colectores estándar, en el colector 
cilíndrico la intercepción de neblina está mayormente influenciado 
por la precipitación (22.6%) que por la radiación solar (10.7%). 


5. Discusión 


A. Influencia del clima 


El análisis de cuantía determinó la influencia de las principa- 
les variables meteorológicas. La velocidad del viento se consolidó 
como la variable que mayor influencia tiene sobre la intercepción 
de neblina, alcanzando el 54.2%, 49.1% y el 54. 5% en el colector 
CFC, SFC35 y SFC5O, respectivamente. Estos resultados coinciden 
con otros estudios en donde se asevera que la velocidad del viento 
es la variable más influyente en la recolección de agua de neblina 
[54], [82] (Ritter et al., 2008; Schemenauer €: Joe, 1989). Aunque 
la correlación directa entre la velocidad del viento y la intercepción 
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de neblina en los colectores no es buena (< 0.55), la influencia pue- 
de ser evidenciada con un gráfico de caja-bigote (Figura 4). 
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Figura 4. Estadísticas de la intensidad de intercepción de neblina en 


cada colector clasificadas por intervalos de velocidad del viento durante 
el periodo de estudio (Junio-Julio 2016) 


En los tres colectores, es evidente que la intercepción de neblina 
incrementa conforme la velocidad del viento incrementa, sobre todo 
en los casos de velocidades del viento altas (mayores a 3 m/s). En 
todos los rangos de velocidad, se observa que existió intercepción de 
neblina en los tres colectores. La intercepción de neblina puede ocu- 
rrir por dos procesos principales, deposición e impactación [83]. En 
condiciones de velocidad del viento baja, la intercepción de neblina 
es controlada por deposición principalmente, por lo que es necesario 
que el contenido de agua en la neblina sea relativamente alto y que 
la superficie de intercepción sea eficiente. Con velocidad del viento 
alta, la impactación es el principal mecanismo de intercepción de 
neblina dado que el contenido de agua en la neblina es inversamente 
proporcional a la velocidad del viento debido al incremento de la 
evaporación potencial [83]. Esto quiere decir que superado cierto 


Evaluación de la cosecha de neblina como una fuente potencial para el aprovechamiento de agua 


valor de velocidad del viento el contenido de agua en la neblina se 
va a reducir al punto en que la intercepción de neblina se reduzca. 
De hecho, Villegas et al., 2008 [83] concluye que las condiciones más 
óptimas de intercepción de neblina son cuando existe un contenido 
de agua en la neblina promedio y velocidades del viento promedio. 
En este caso de estudio, se puede apreciar que el contenido de agua 
en la neblina es relativamente alto, dado que no se alcanzó el umbral 
de velocidad del viento en donde la intercepción de neblina se reduz- 
ca. Se podría deducir que este hecho evidencia el potencial de inter- 
cepción de neblina en la parte alta de San Cristóbal, donde incluso 
con una reducción en el contenido de agua en la neblina (efecto que 
podría presentarse debido al cambio climático) todavía se tendría 
condiciones óptimas de intercepción de neblina. 

La dirección del viento no tuvo una influencia importante en 
la intercepción de neblina de los colectores, incluyendo los bidi- 
mensionales (SFC35 y SFC50). Esto puede ser explicado porque la 
dirección del viento se mantuvo relativamente constante durante 
todo el periodo (Figura 5). 
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Figura 5. Diagrama de frecuencias relativas de la dirección del viento en 
todo el período de estudio, Junio-Julio 2016 
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Durante el 90% del tiempo en que se registró intercepción 
de neblina en alguno de los colectores, la dirección del viento se 
mantuvo entre 170 y 2307, que correspondería apenas en una reduc- 
ción máxima del 13% de la intercepción de neblina en la dirección 
perpendicular al área de colección de los colectores. Estas condicio- 
nes son ideales para el uso de un colector bidimensional sobre un 
cilíndrico, siendo el primero más sencillo de construir, ocupa menos 
espacio para una misma área de colección y resulta más barato (en 
la siguiente sección se discutirá su eficiencia). 

La radiación solar también presentó una influencia importante 
en la intercepción de la neblina en todos los colectores. Su contri- 
bución en la intercepción de neblina es la más variable alcanzando 
un valor de 10.7% en el colector CFC, 33.4% en el colector SFC35 y 
22.9% en el colector SCF50. Existe una influencia apreciable entre 
la magnitud de la radiación solar durante las horas de sol y la inten- 
sidad de la intercepción de neblina por los colectores (Figura 6), 
siendo la intercepción de neblina por los colectores mayor cuando 
la radiación solar es más baja. Por esto, la radiación solar puede ser 
una variable que evidencie la presencia de neblina y de su contenido 
de agua en el aire. 
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Figura 6. Estadísticas de la intensidad de intercepción de neblina en 
cada colector clasificadas por intervalos de radiación solar durante el 
periodo de estudio (junio-julio 2016) 
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La intercepción de neblina durante las horas del día ocurrió 
durante el 38%, el 39% y el 41% del tiempo en el colector CFG, 
SFC35 y SFC5O, respectivamente. Esto quiere decir que durante 
mayor tiempo (aproximadamente el 60%), la intercepción de neblina 
ocurrió en la noche. La radiación solar promedio cuando existió inter- 
cepción de neblina en alguno de los colectores fue de 133 W/m”. Este 
valor resulta bajo comparado con la radiación solar promedio cuando 
no existió intercepción de neblina (285 W/m”) y peor con la radiación 
solar promedio para cielo despejado (441 W/m?) calculado a partir de 
la radiación extraterrestre. Sin embargo, esto puede ser debido a que 
la intercepción de neblina pudo ocurrir en horarios muy tempranos o 
muy tarde del día. Esto no es correcto ya que la intercepción de nebli- 
na ocurrió durante todo el día (Figura 7), presentándose las mayores 
magnitudes de intercepción de neblina en los colectores alrededor de 
las 7 de la mañana y las menores magnitudes alrededor de las 1 de 
la tarde. La reducción de la radiación solar debido a la presencia de 
neblina ya se ha evidenciado en otros sitios, como es el caso del lado 
sotavento de Hawaii, en el cual la neblina redujo en 36% la insola- 
ción, en Puerto Rico el 48% y en las Islas Canarias el 58% [54], [84], 
[85]. En el caso de San Cristóbal, la reducción de la insolación fue 
relativamente baja alcanzando un valor del 30%. 
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Figura 7. Variación horaria de las variables meteorológicas más 
influyentes en la intercepción de neblina (velocidad del viento, 
radiación solar y precipitación) e intercepción de neblina por cada 
colector durante el periodo de estudio (Junio-Julio 2016) 
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La precipitación es otra de las variables que afecta la intercep- 
ción de neblina pero en menor medida. Su contribución en la inter- 
cepción de neblina fue del 22.6%, 8.5% y 11.6% en el colector CFC, 
SFC35 y SFC5O, respectivamente. Del total de neblina interceptada 
por los colectores, la neblina captada sin la existencia de precipita- 
ción representó el 75.7% en el colector CFC, el 98.2% en el colector 
SFC35 y el 95.7% en el colector SFC50. Claramente la precipitación 
no tiene influencia en la intercepción de neblina de los colectores 
estándar, pero sí la tiene en el colector cilíndrico. Al ver el gráfico 
de caja-bigote (Figura 8), se puede evidenciar que la intensidad de 
intercepción de neblina del colector CFC no está influencia por la 
intensidad de precipitación, y que en este colector se llega intercep- 
tar neblina con las mayores intensidades de precipitación (0.3 y 0.4 
mm/h). Aunque el porcentaje de neblina interceptaba con intensi- 
dades mayores a 0.2 mm/h es de apenas el 12%. 
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Figura 8. Estadísticas de la intensidad de intercepción de neblina en 
cada colector clasificadas por intervalos de precipitación durante el 
periodo de estudio (Junio-Julio 2016) 


Variables como la temperatura y la humedad relativa presen- 
tan una contribución pequeña en la intercepción de neblina (con- 
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tribución combinada menor del 8.2% en el mejor de los casos que 
corresponde al colector SFC50). Sin embargo, esto no quiere decir 
que su monitoreo no sea importante o que las variables no tengan 
realmente influencia. Ambas variables están relacionadas con el 
contenido de agua en el aire de la neblina. La humedad relativa 
indica el grado de saturación del aire, por lo que mientras mayor 
es la humedad relativa, mayor es el contenido de agua en el aire. 
La temperatura también tiene influencia en esta variable ya que el 
contenido de agua en el aire de la neblina está inversamente rela- 
cionado con el calor latente de condensación de la temperatura del 
agua [86]. Dominguez et al., 2017 [43] al estudiar la intercepción 
de neblina por parte de la vegetación endémica de San Cristóbal, 
compararon la intercepción de neblina por parte de la vegetación 
de dos temporadas de garúa distintas, y evidenciaron una diferencia 
significante, que dadas las condiciones (existió una diferencia signi- 
ficativa en la temperatura de las dos temporadas producto de una 
anomalía en la temperatura de la superficie del mar por el efecto 
temprano del evento de El Niño en la región 1+2), la atribuyeron 
a una diferencia en el contenido de agua en el aire de la neblina. 
En este caso de estudio, el monitoreo de la temperatura y la 
humedad relativa fue de dos meses durante la temporada de garúa, 
en donde las condiciones fueron relativamente constantes y es por 
esto que las dos variables no tuvieron una gran influencia en la 
intercepción de neblina por parte de los colectores. Posiblemente 
con un monitoreo más largo, que incluya la temporada cálida de 
invierno, se podría ver una mayor influencia de estas variables. 


B. Comparación de colectores 


El colector que presenta la mayor eficiencia de captación 
de neblina es el SFC50. Su intensidad de intercepción de neblina 
durante el periodo de estudio (4.8 mm/día) es 1.31 veces mayor 
que el colector CFC y 1.18 veces mayor que el colector SFC50. En 
el caso de captación de precipitación y neblina, también presenta 
un mayor rendimiento. El colector CFC presenta la peor eficiencia 
para captación de neblina. Esto puede ser explicado al repasar la 
dinámica del flujo de las gotas de agua de neblina que atraviesan 
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una malla. La eficiencia de colección de neblina de un colector 
depende de su eficiencia aerodinámica, eficiencia de impactación y 
eficiencia de drenaje [61], [87]-[89]. La eficiencia de aerodinámica 
está relacionada a la capacidad que tiene la malla de dejar pasar el 
flujo de aire con neblina a través del mismo sin perturbar su curso. 
La eficiencia de impactación depende de la capacidad que tiene la 
superficie de la malla en atrapar las gotas de agua en la neblina que 
atraviesa la misma. La eficiencia de drenaje se refiere la capacidad 
que tiene la malla en drenar el agua de neblina captada por la malla 
rápidamente. La eficiencia total de un colector va a depender de la 
interacción de estas tres eficiencias. El colector CFC al ser cilíndrico, 
tiene una superficie aerodinámica que ayuda al paso lateral del flujo 
de aire con neblina, por lo que una parte del flujo en vez de atrave- 
sar el colector pasa rodeando su superficie y por lo tanto reduciendo 
su capacidad de colectar neblina. Además, su coeficiente de sombra 
relativamente alto, su pequeño tamaño de las aperturas de la malla 
y la forma cruzada de sus elementos, a pesar de mejorar la eficiencia 
de impactación (al existir una mayor área de obstrucción) producen 
un efecto adverso en la intercepción de neblina, las gotitas de agua 
que se interceptan bloquean el flujo de aire a través de los agujeros 
de la malla volviéndola más impenetrable [61 |concomitantly with a 
reduction in ambient temperature and an increase in wind velocity 
(u, produciendo que una mayor parte del flujo de aire no atraviese 
la malla y se desvíe. Este flujo que es desviado además de no llevar 
las gotas de agua a la malla puede acarrear las gotas que se encuen- 
tran en la malla y sacarlas fuera del área de colección. Esta situación 
podría empeorarse debido a la forma de la malla, que al tener fibras 
horizontales a poco distancia, la eficiencia de drenaje es reducida 
[88]. Este conjunto de factores podría explicar el bajo rendimiento 
del colector CFC en comparación de los otros colectores y además 
el por qué la intercepción de neblina en este colector es influencia- 
do por la precipitación. En los eventos de neblina y precipitación, 
probablemente la lluvia, al tener un diámetro de gotas más grandes, 
choca con la malla y coalesce con las gotitas de agua de neblina 
interceptadas por la malla, mejorando el drenaje como consecuencia 
de su mayor tamaño. 
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Los dos colectores SFC tienen las mismas dimensiones y la 
misma estructura. La única diferencia es su coeficiente de sombra. El 
SFC35, al tener más aberturas que el SFC50 permite el flujo del aire 
con neblina a través de su malla más fácilmente reduciendo la resis- 
tencia aerodinámica. Por el contrario, SFC35 tiene una menor área 
de impactación reduciendo la posibilidad de captar gotas de neblina 
en cuyo caso SFC5O sería más eficiente. Determinar la eficiencia de 
impactación y drenaje de estos colectores resulta en una serie de 
ecuaciones que dependen de varias variables y cuya determinación 
no entran en el alcance de este estudio (se recomienda leer Regala- 
do €: Ritter, 2016 [88] para revisar estas ecuaciones). Sin embargo, 
la eficiencia aerodinámica puede ser determinada de forma teórica. 
Rivera, 2011 [87] utilizó un principio de superposición para separar 
el flujo de aire que elude un colector de neblina teórico impermea- 
ble y el flujo que pasa libremente a través de los agujeros de un 
colector de neblina. A partir de estas relaciones obtuvo el siguiente 
modelo para determinar la eficiencia aerodinámica: 

a =— 0D, 

1+ /cp 

donde SC es el coeficiente de sombra de la malla, C,, es el coefi- 
ciente de arrastre y C, es el coeficiente de caída de presión. El coeficien- 
te de arrastre depende del número de Reynolds y para flujo turbulento 
(esperado en condiciones típicas de neblina), C tiene valores desde 1 
para colectores cilíndricos hasta 2 para colectores cóncavos [87], [88]. 
Colectores de forma cuadrada alcanzan el valor de 1.18 [87], [90]. Co 
resulta de la relación de presiones entre el lado barlovento y sotavento 
del colector. Para el caso de una malla de seda (lo más parecido al mate- 
rial plástico o polietileno), puede ser determinado por [87]: 


2 
Co = 1.62 (1.35C + (—) ) (12), 

siendo C,, únicamente dependiente del coeficiente de sombra. 

De acuerdo a estas fórmulas, la eficiencia aerodinámica del colector 

CFC, SFC35 y SCE5O es de 0.16, 0.17 y 0.2, respectivamente. La efi- 

ciencia aerodinámica del colector SFC50 es la mayor, coincidiendo 

con los resultados encontrados en este estudio. La relación de las 
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eficiencias aerodinámicas entre colectores es similar a la relación 
del rendimiento de captación de neblina entre colectores (Tabla 7). 


Tabla 7. Relación de rendimiento experimental y eficiencia 
aerodinámica teórica entre colecotres 





a. Rendimiento de cada colector estimado a partir de la intercepción de neblina total 
registrada en el periodo de estudio. 
b. Eficiencia teórica de cada colectore estimada a partir de la ecuación 11. 


De acuerdo a la literatura [82], [87], [88] el colector de 50% 
de coeficiente de sombra tiene una mayor eficiencia que el colector 
de 35%. De acuerdo al modelo usado (Figura 9), las mejores eficien- 
cias aerodinámicas se presentan entre valores de 50 y 60% de coefi- 
ciente de sombra [87]. Estos valores coinciden con las conclusiones 
de Schemenauer €: Joe, 1989 [82] en un estudio experimental en 
el norte de Chile, en donde usó una doble capa de malla Raschel de 
35% de coeficiente de sombra (que resulta en valores aproximados 
al 50% de coeficiente de sombra). 


30 








— Cp=1 
— Cp=1.18 
25 
pS 
q SFC50 
E 20 
E SFC35 
«0 
£ 
9 15 CcFC 
(0) 
(0 
O 
2 10 
nO) 
AS) 
úl 
5 
0 | ñ | 1 | 1 | ñ | 
10 30 50 70 90 


Coeficiente de sombra ( % ) 


Figura 9. Variación de la eficiencia aerodinámica en función del 
coeficiente de sombra de un colector (ecuación 11) 
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C. Comparación con otros sitos 


En San Cristóbal el colector SFC50 tuvo un rendimiento de 
captura de neblina y precipitación de 8.5 1/m“día durante dos 
meses de la época de garúa. Este valor se encuentra por encima del 
promedio mundial (Figura 10). 
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Figura 10. Tasa de intercepción de neblina en varios sitios a nivel global 


Se han reportado rendimientos de 3 y 9 1/m”“-día, en Chile 
y Perú, respectivamente, durante la época de neblina utilizando 
colectores de neblina estándar [45]. En un estudio en la zona del 
Caribe sudamericano (Colombia y Venezuela), Cavelier 8. Goldstein, 
1989 [37] realizaron un estudio sobre la intercepción de neblina 
encontrando que la intercepción de neblina varía entre 0.2 y 2.2 
mm/día e identificaron que la intercepción de neblina sigue un gra- 
diente orográfico en esta zona. En Sierra Madre, México, se regis- 
tran valores entre 0.4 y 1.6 1/m*día a elevaciones de 1330 a 1900 
msnm [91]. Mientras que la recolección en Mauna Loa en Hawaii, 
a 2530 y 1580 msnm, alcanza valores de 1.9 y 2.1 mm/día utili- 
zando un colector cilíndrico tipo Juvik [56]. En Asia, en regiones 
áridas, se han realizado mediciones de intercepción de neblina con 
varios propósitos. En Omán, Yemen y Arabia Saudita la recolección 
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de neblina ha sido de 8, 4.5 y 2 1/m“-día, respectivamente [45], 
[821], [92]. En las montañas de la región de Dhofar (Omán), en una 
elevación entre 900 y 1000 msnm, se registró una alta recolección 
de neblina con un promedio de 30 1/m”-día durante tres meses de 
la temporada del monzón [45]. En el caso de Europa, se han rea- 
lizado estudios principalmente en las islas Canarias, encontrando 
valores entre 0.2 y 5.0 1/m“-día en la isla La Gomera [54] y valores 
de 1.3 a 1.8 1/m“-día en Tenerife [52], [61]Taborno (1015 m a.s.l.. 
En la región Mediterránea de Valencia, se registró valores máximos 
de recolección de neblina hasta 7 1/m”día [51]mientras que en 
Croacia en la montaña Velebit, la intercepción de neblina alcanzó 
valores hasta de 4 1/m*-día [93]. En África, la recolección de neblina 
también ha sido relevante. Sitios como la costa oeste de Sudáfrica, 
donde se han recolectado 0.4 1/m”-día y 1.3 1/m”día, en Brand se 
Baai y Kalkbaken se Kop, respectivamente [94]. En éste último, la 
recolección de neblina es mayor y se atribuye a que se encuentra a 
más altura y además la velocidad del viento es mayor, siendo de 5.2 
m/s en promedio, mientras que en Brand se Baai es de 4.3 m/s. En 
Cape Columbine el promedio de recolección de agua es de 5.7 l/ 
m'“día [94]. En Cabo Verde, se reportó un promedio de recolección 
de neblina de 12 5 1/m*día [95]. 


D. Implementación del sistema de colección de neblina 


De acuerdo a los resultados de este estudio, se pudo eviden- 
ciar que tanto los colectores estándar como el colector cilíndrico son 
propicios para la captura de neblina en el Archipiélago. Dado que la 
dirección del viento no sufre variaciones drásticas y que los colecto- 
res estándar tienen un mejor rendimiento, se recomendaría el uso 
de colectores estándar, de preferencia colectores SFC50. Echeverría, 
2018 [96] estimó la demanda de agua para consumo doméstico 
de la zona rural de San Cristóbal, obteniendo un valor de 80.3 l/ 
día: habitante. Para el caso de fincas, la autora estimó que una fami- 
lia promedio se compone de 5 personas, por lo que una finca tendría 
una demanda de 401.5 l/día. Esto quiere decir que de acuerdo a 
los resultados de este estudio, durante la época seca, colectores de 
neblina con una malla raschell de 50% de coeficiente de sombra con 
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un área de intercepción de 48 m” ubicados a una elevación de 600 
m.s.n.m. podrían cumplir 100% de la demanda (para elevaciones 
más bajas se necesitaría un área mayor de recolección). Utilizando 
un sistema de colección de aguas lluvias en el techo con un área de 
200 m2 se podría colectar 0.3 1/día. Existen varias comunidades que 
han utilizado la cosecha de neblina como una fuente de agua para 
su población. Chungungo, una comunidad ubicada en la zona desér- 
tica de la costa de Chile utiliza un sistema de cosecha de neblina de 
100 colectores grandes (10x4 m), produciendo en promedio 15000 
l de agua potable para 300 habitantes de la villa [32]. De acuerdo 
a Batisha, 2015 [15], otros proyectos de colección de neblina están 
produciendo 6300 l/día en Tojquia (Guatemala) con 1400 m2 de 
superficie de colección y cantidades viables en sitios como Sudáfri- 
ca, Perú y Colombia. 

Los sistemas de colección de neblina además de ser amigables 
con el medio ambiente (no requieren energía eléctrica), sostenibles 
en el tiempo (bajo costo operacional) también resultan ser relativa- 
mente baratos comparados con otros sistemas convencionales que 
requiere una inversión inicial grande, costos operacionales altos y 
un alto mantenimiento [32]. 

En Chile, un sistema de cosecha de neblina puede ser produ- 
cido por cerca de $1 por m* y transportado a los hogares de una 
comunidad lejana por $1 por m* [44]. Batisha, 2015 comenta que 
el costo de 100 colectores de neblina grandes, adecuado para una 
pequeña comunidad, estaría en el orden de $40000, que es barato 
comparado con otros sistemas de agua. Claramente, este sistema 
alternativo de agua tiene un potencial alto. Ciudades y comunidades 
inteligentes, deben tomar en cuenta sistemas de agua sustentables y 
amigables con el ambiente como es el caso de la cosecha de neblina. 


6. Conclusiones 


La parte alta de la isla San Cristóbal (Galápagos) está cubierta 
por una capa de neblina casi permanente durante 7 meses al año. 
Aprovechando este fenómeno, durante dos meses se ha instalado 
colectores de neblina para cuantificar la intercepción de neblina y 
evaluar su potencial como una fuente de agua alternativa para las 
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comunidades del sector. Se usaron tres colectores de neblina, uno 
cilíndrico y dos colectores estándar bidimensionales de 35 y 50% de 
coeficiente de sombra. Las mediciones fueron complementadas con 
el monitoreo de las principales variables meteorológicas. 

Los resultados muestran que el rendimiento de los colectores 
es de 3.8, 7.0 y 8.5 1/m“-día en el colector CFC, SFC35 y SCE5O, 
respectivamente. Utilizando un modelo geométrico, se determinó la 
profundidad de intercepción de neblina únicamente (separado de 
la precipitación), obteniéndose valores de 176.5 mm en el colector 
CFC, 195.8 mm en el colector SFC35 y 230.6 en el colector SFC5O. 
Estos valores corresponden a más del 242% de la lluvia, lo que 
evidencia el potencial de intercepción de neblina en el sector. Así 
mismo, el rendimiento del colector SFC50 está por encima del pro- 
medio de intercepción de neblina mundial. 

Al igual que en otros estudios, se determinó que la velocidad 
del viento es la variable que más influencia tiene sobre la intercep- 
ción de neblina (aprox. 50%), seguida de la radiación solar y de la 
lluvia. Esta última tiene una mayor influencia en el colector CFC. El 
hecho de que la intercepción de neblina incremente con la velocidad 
del viento y no se estanque en una meseta indica el potencial de 
neblina de sector, incluso con velocidades del viento más fuertes o 
un contenido de agua en el aire más bajo. La dirección del viento no 
tuvo influencia sobre la intercepción de neblina porque permaneció 
relativamente constante durante el periodo de estudio, lo que justi- 
fica el uso de colectores bidimensionales en vez de colectores cilín- 
dricos que tienen una menor eficiencia de recolección de neblina. 

El colector SFC50 resultó ser el que mayor eficiencia de inter- 
cepción de neblina tiene. Esto se puede explicar por su coeficiente de 
sombra, el cual permite una mayor área de obstrucción para inter- 
ceptar las gotas de agua en el flujo de aire que atraviesa su malla 
sin causar demasiadas obstrucciones que obliguen al flujo de aire 
desviarse de su trayectoria de intercepción con la malla. El colector 
CFC es el que menor eficiencia tiene, debido a su forma aerodinámica 
permite el paso lateral del flujo del aire. Además, el pequeño tamaño 
de sus aberturas induce a la obstrucción de las mismas con gotas de 
agua, haciendo que la superficie sea menos permeable y por lo tanto 
se capte menor neblina. Se concluye que la influencia de la lluvia en 
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la intercepción de neblina en este colector es debido a que ayuda al 
drenaje rápido de la neblina interceptada en la malla. 

El potencial de cosecha de neblina en Galápagos como una 
fuente alternativa de agua resulta evidente. Este sistema podría ser 
implementado como una fuente alternativa de agua para este sec- 
tor, sobre todo en las islas donde los recursos hídricos superficiales 
permanentes son escasos o inexistentes. Esta información es de vital 
importancia para las autoridades que trabajan en el manejo de los 
recursos hídricos en estas islas, sobre todo por el hecho de la esca- 
sez de fuentes superficiales de agua en este territorio. Así mismo, la 
metodología usada sirve para la evaluación de la implementación 
de un sistema de cosecha de neblina en otras partes del mundo. 
Claro que sería necesario complementar esta investigación con la 
evaluación de la calidad del agua interceptada de la neblina, una 
evaluación económica y el uso de otras tecnologías de intercepción 
de neblina (ej. material hidrofóbico [97]). En la planeación de 
desarrollar ciudades inteligentes, la sostenibilidad es un aspecto 
importante. Técnicas como la cosecha de neblina, entran dentro de 
esta idea de sostenibilidad. 
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Resumen 


Uno de los problemas con que se enfrenta el ingeniero civil es el diseño adecuado de 
estructuras. En ese sentido, existen normas a nivel mundial que regulan el diseño y 
construcción de edificaciones solicitadas por acciones sísmicas. El objeto es hacer a 
las estructuras dúctiles, es decir que puedan experimentar grandes deformaciones, sin 
pérdida de resistencia y que no colapsen aun cuando actúe el sismo más severo. 

En numerosas normas a nivel mundial se establece realizar estudios particulares de 
sitio o de propagación de ondas sísmicas en obras importantes, sin embargo no se des- 
carta su aplicación en obras que pudiesen ser consideradas como poco importantes por 
el aspecto económico, sin dejar de serlo por el aspecto de salvar vidas. En ese sentido, 
en aquellos casos en que la edificación se encuentre en la cercanía a fallas activas o 
exista la presencia de estratos de suelos susceptibles a licuar o de suelos que degradan 
su rigidez o resistencia con la deformación bajo el efecto de carga cíclica deben ser 
objeto de la realización de estudios particulares de sitio. Por ello, se presenta en el 
siguiente trabajo la metodología utilizada para realizar un estudio particular de sitio, 
mostrando entre otros aspectos la degradación de rigidez y resistencia de los suelos, 
la evaluación del potencial de licuación de arenas, los niveles de deformación que ex- 
perimentan los estratos de suelos y el espectro de diseño obtenido como insumo para 
el análisis dinámico de estructuras. 


Palabras clave 


Deformación cíclica, efectos de sitio, espectro de diseño, licuación, ondas sísmicas, 
propagación, respuesta dinámica. 
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Abstract 


One of the problems facing the civil engineer is the proper design of structures. In that 
sense, there are worldwide standards that regulate the design and construction of build- 
ings requested by seismic actions. The object is to make the structures ductile, so, it can 
undergo great deformations, without loss of resistance and do not collapse even when the 
most severe earthquake acts. 

In numerous standards at world-wide it is established to realize particular studies of site 
or to evaluate the propagation of seismic waves in major constructions, nevertheless it 
is not discarded its application in works that could be considered as unimportant by the 
economic aspect, without ceasing to be for the aspect of saving lives. In this sense, in those 
cases in which the building is in the vicinity of active faults or there is the presence of 
strata of soils susceptible to liquefying or of soils that degrade their rigidity or resistance 
with the deformation under the effect of cyclic loading must be object of the realization of 
particular site studies. For this reason, the methodology used to carry out a particular site 
study is presented in the following work, showing, among other aspects, the degradation 
of soil stifíness and resistance, the evaluation of the liquefaction potential of sands, the 
deformation levels reached by the soil strata and the design spectrum obtained as input for 
the dynamic analysis of structures. 


Keywords 


Gyclic deformation, design spectrum, dynamic response, liquefaction, propagation, seismic 
waves, site effects. 


1. Introducción 


Existen en el país numerosos sistemas de fallas activas que por 
su cercanía a obras civiles, bien sea por construir, u obras existentes 
donde se desee evaluar cuál es el comportamiento dinámico de la 
estructura y qué medidas de reforzamiento deben ser implementa- 
dos ante acciones sísmicas, amerita la realización de estudios parti- 
culares de sitio. Igualmente, la presencia de estratos o depósitos de 
suelos potencialmente licuables [1-2-3] o de suelos que degradan 
su rigidez o resistencia bajo el efecto sísmico deben ser objeto de 
un estudio particular de sitio, a fin de diseñar apropiadamente 
el sistema de cimentación, así como el cuantificar los niveles de 
degradación de rigidez y resistencia que puedan experimentar los 
suelos, determinar el factor de seguridad contra la licuación de los 
depósitos granulares sueltos saturados y la generación del espectro 
de diseño que servirá como insumo para la realización del análisis 
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dinámico de la estructura. En ese sentido se presenta a continuación 
la metodología seguida para realizar un estudio particular de sitio 
mostrando su aplicación en el análisis de licuación de los suelos y la 
generación del espectro de diseño para un sitio en particular. 


2. Materiales y métodos 


El presente trabajo constituye una investigación cuantitativa 
del tipo cuasi-experimental [4], por cuanto se estudia la relación 
causa-efecto de fenómenos naturales como los sismos, sobre depó- 
sitos de suelos donde no existe un control riguroso de la variable 
independiente que es la historia de aceleraciones sísmicas. Los 
mismos provienen de registros instrumentales disponibles en la red 
sismológica mundial [5]. De acuerdo con la definición operacional 
de variables, en este estudio se presentan: 

Variables Independientes: comprende los registros sísmicos 
medidos en roca y los perfiles litológicos caracterizados por su espe- 
sor, peso unitario y velocidad de ondas de corte, entre otros. 

Variables Intervinientes: comprende la herramienta o algorit- 
mo de cálculo [6] que permite cuantificar los efectos que produce 
el sismo en el comportamiento dinámico del perfil del suelo. Esta 
variable no será sometida a investigación, por cuanto se parte de la 
premisa de que el algoritmo de cálculo ha sido desarrollado y vali- 
dado por personal altamente especializado [7-8]. 

Variables Dependientes: comprende la historia de aceleracio- 
nes en superficie, espectros de respuesta, lazos de histéresis, trayec- 
toria de esfuerzos, incremento en presión de poros, entre otros. 

La muestra de estudio se circunscribe a depósitos de suelos, satu- 
rados, susceptibles a experimentar el fenómeno de licuación, estratos 
de suelos que pueden degradar su rigidez y resistencia bajo el efecto 
de carga cíclica, estratos de arenas o arcillas competentes en los que se 
desea cuantificar los niveles de deformación cíclico, así como los nive- 
les de degradación que pueden alcanzar a fin de elaborar las curvas de 
capacidad portante de cimentaciones profundas con profundidad. 

La metodología a seguir para cumplir con el objetivo propues- 
to en este estudio se presenta continuación: 
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Recopilación bibliográfica de trabajos realizados que tienen 
relación con el tema objeto de estudio, destacándose entre ellos: 
evaluación del potencial de licuación [9-10], modelos constitutivos 
que consideren degradación de resistencia, cambio en rigidez y 
amortiguamiento en los suelos con la deformación y aumento de 
presión de poros [11-12-13-14], entre otros. 

Ubicación y selección de código de cálculo o programa que 
permita evaluar la respuesta dinámica de suelos, y particularmente 
considere los cambios de rigidez y amortiguamiento con el aumento 
de presión de poros, así como su disipación en el tiempo. 

Construir un perfil de suelo representativo del lugar en donde 
se realizará el estudio particular de sitio. Seleccionar sismos ins- 
trumentales registrados en roca en correspondencia con el nivel de 
amenaza esperado en el sitio de estudio y su distancia o cercanía a 
las fallas activas. Aplicar en la base del perfil geotécnico los acelero- 
gramas de entrada definidos previamente. 

Obtener la historia de aceleraciones en superficie, lazos de 
histéresis, historia de aumento de presión de poros, entre otros. 

A partir de la historia de aceleraciones en superficie construir 
los espectros de respuesta para una estructura elástica de 1 grado 
de libertad (gdl). 

Realizar el análisis de las respuestas obtenidas cuantificando 
la aceleración máxima en superficie, la amplificación y la genera- 
ción de espectros de respuesta. Así mismo cuantificar los niveles 
de deformación que se producen a lo alto del depósito, la determi- 
nación de los niveles de degradación de rigidez y resistencia de los 
suelos que componen la columna litológica, la evaluación de los fac- 
tores de seguridad contra la licuación que puedan sufrir los suelos 
granulares, sueltos, saturados. 


2.1. Respuesta dinámica de suelos bajo acciones sísmicas 


El estudio particular de sitio o la respuesta dinámica del suelo 
bajo acciones sísmicas consiste en imponer en la base del depósito 
sismos representativos, cuyas características se correspondan con 
el estudio de amenaza, en cuanto a magnitud esperada, distancia 
epicentral y aceleración en roca, los cuales se propagan a través del 
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depósito de suelo o columna litológica y permiten determinar los 
valores de esfuerzos de corte y deformaciones máximas impuestas 
por el sismo, con profundidad, y las aceleraciones que podrían pro- 
ducirse o el espectro de respuesta. 

Una vez determinadas las deformaciones máximas de corte 
con profundidad o la movilidad cíclica, podrán determinarse los 
valores de degradación de la rigidez y resistencia, utilizando resul- 
tados de ensayos de corte cíclicos normalizados reportados en la 
literatura [11] o de ensayos de corte cíclico a esfuerzo controlado o 
deformación controlada realizado en muestras representativas de la 
zona objeto de estudio. 

Con los valores de esfuerzos de corte máximos con profundi- 
dad impuestos por el sismo se podrán determinar los valores de CSR 
o razón de esfuerzo cíclico correspondiente a 0.65 veces el valor 
máximo de corte dividido entre el esfuerzo vertical efectivo. En el 
caso de los suelos granulares se determinará si el estrato granular 
licuará o no al comparar los valores de CSR con los valores de CRR 
(cyclic resistance ratio) o la resistencia al corte cíclico de las arenas 
derivado de la resistencia de punta del cono del ensayo CPTU o del 
ensayo SPT [15]. En el caso de los suelos arcillosos, basado en los 
niveles de deformación alcanzados se degradará su rigidez y resis- 
tencia (movilidad cíclica). 

Con los valores de rigidez y resistencia degradados con pro- 
fundidad y la identificación de los estratos granulares que experi- 
mentan licuación, permitirá definir los factores que modifican tanto 
la rigidez como la resistencia de las curvas p-y y t-z al ser sometido 
el pilote o cimentación profunda a carga lateral o axial, respectiva- 
mente, tanto en el campo libre como en el campo cercano. 


2.2. Estudio de la respuesta dinámica de un sitio en particular 


Para la ejecución de un estudio particular de sitio se realiza- 
rían las siguientes actividades: 


e Selección de sismos instrumentales de la red mundial, en lo posi- 
ble, con origen tectónico similar al de la zona objeto de estudio. 

e Selección de los perfiles geotécnicos y sus parámetros para 
realizar las corridas con el programa CYCLIC 1D. 
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e Procesamiento de la salida de resultados y elaboración de 
perfiles de respuesta de las deformaciones máximas de corte y 
esfuerzos de corte máximos con profundidad. 

e Elaboración de espectros de respuesta en superficie para cada 
uno de los sismos incluidos en el estudio. 

e Determinación de la mediana de los espectros y el correspon- 
diente a la media más una desviación estándar. 

e Elaboración de los espectros de diseño. 


Se debe tener especial cuidado de seleccionar sismos cuyos 
registros han sido medidos en roca, sin estar influenciados por la 
presencia de estructuras cercanas. Este tipo de registros son consi- 
derados como obtenidos en afloramientos rocosos presentes en el 
campo libre (freefield-outcropping). 

La cantidad de sismos seleccionados deberán ser como mínimo 
3 en correspondencia con la norma ecuatoriana NEC-SE-DS [16], 
los cuales se consideran representativos y cumplen con lo mínimo 
exigido en las normativas vigentes para la realización de estudios 
particulares de sitio. Para la realización del presente estudio se han 
seleccionado 7 sismos instrumentales para realizar los análisis. 


3. Movilidad cíclica 


Con el objeto de determinar los niveles de deformación induci- 
dos por los sismos en los estratos que componen el Perfil Litológico, 
se recurrió al uso del programa o código de cálculo Cyclic 1-D. 

El programa CYCLIC 1-D [6-7-8], fue desarrollado para eva- 
luar la respuesta dinámica de suelos donde está involucrado el com- 
portamiento no lineal e histerético asociado a los cambios en rigidez 
y amortiguamiento con la deformación por efecto sísmico, además 
de incluir los incrementos y disminuciones de la presión de poros y 
como ello afecta los esfuerzos totales y efectivos y en consecuencia 
la resistencia al corte del material. 

Mediante el uso del programa se obtendrán los valores de 
deformación por corte máximos con profundidad a fin de identificar 
por sectores cuales son los niveles de deformación máximos alcanza- 
dos cuando la columna de suelo es sometida en su base al escenario 
de sismos previamente establecido de los estudios de amenaza. 
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A partir de los valores de deformaciones máximas alcanzadas 
(g max) se determinará la deformación por corte cíclica equivalente 
(0.65 g max), que al introducirlo en la Figura 1, envolvente de resul- 
tados obtenidos de ensayos de corte cíclicos realizados en muestras 
seleccionadas, se obtendrían los respectivos valores de degradación 
de rigidez que se producen en el campo libre. 

Particularmente se presenta en la figura 1, en el eje de las 
ordenadas la degradación del módulo de corte (G/Gmax) con la 
deformación por corte cíclica al someter las muestras de suelos a 
ensayos de corte a deformación controlada bajo la acción de 15 a 30 
ciclos de carga y descarga. 


Degradación de Rigidez (9) vs. Deformación por corte 
ciclico(y %) entre 15 y 30 cíclos 
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Figura 1. Degradación de rigidez de los suelos con la deformación por 
corte cíclico en muestras sometidas a ensayos de corte cíclico (DSS) 


Los valores derivados de los ensayos dinámicos indican que 
hasta deformaciones por corte cíclicos de 0.6%, la degradación de 
rigidez (9) es del orden de 0.8. Para deformaciones por corte de 1% 
y 2% el valor de 6 es de 0.7 y 0.5 respectivamente. 

El estudio de propagación de ondas sísmicas a través de la colum- 
na litológica del suelo ha permitido elaborar la gráfica de los valores 
de deformación equivalentes correspondientes a 0.65 veces la deforma- 
ción máxima que se representan en las Figuras 2 y 3 al utilizar sismos 
representativos del estudio de amenaza considerando periodos de 
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retorno de 200 años, escenario SLE (Strength Level Earthquake) y 1000 
años, escenario DLE (Ductility Level Earthquake) respectivamente. 
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Figura 2. Deformación equivalente por corte cíclico con 
profundidad — Escenario SLE, periodo de retorno 200 años 
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Figura 3. Deformación equivalente por corte cíclico con profundidad — 
escenario DLE, periodo de retorno 1000 años 
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De las figuras 2 y 3 se concluye que los estratos ubicados por 
debajo de los 7 m de profundidad experimentan una movilidad o una 
deformación por corte cíclica equivalente que no supera el 0.3% bajo los 
escenarios SLE y DLE, la cual va disminuyendo con profundidad, valor 
bajo de movilidad cíclica que producirá bajos valores de degradación 
de rigidez y resistencia. Mientras que el estrato de suelo ubicado entre 
los O y 7 m de profundidad, correspondiente a arenas sueltas saturadas 
experimenta altos niveles de deformación cuyo análisis del factor de 
seguridad contra la licuación se presenta en el siguiente aparte. 


4 . Licuación de suelos 


La licuación de los suelos es un fenómeno que ocurre en suelos 
granulares, sueltos, saturados ubicados por debajo del nivel freático. 
Se trata de arenas con poco contenido de finos o limos no plásticos 
que al ser sacudidos por la acción sísmica, tienden a disminuir de 
volumen. El agua intersticial presente en los poros o espacios vacíos 
no tiene la suficiente rapidez para migrar, lo cual provoca que la 
presión de poros aumente y se iguale al esfuerzo efectivo, bajo 
dicha condición se produce una pérdida significativa de resistencia 
haciendo que el suelo se comporte como un líquido y alcance lo que 
se conoce como licuación con un valor de resistencia al corte muy 
bajo o resistencia residual. 

Una simulación realizada con el programa Cyclic 1-D, el cual 
permite aplicar en la base del depósito sismos instrumentales regis- 
trados en la red mundial permite visualizar como es el comporta- 
miento bajo la acción sísmica. 

El esfuerzo de corte impuesto por el sismo tiende a aumentar 
linealmente con profundidad, como se muestra en la Figura 4, al 
igual que el esfuerzo confinante, al cual está asociada una mayor 
resistencia al corte o esfuerzo cedente, pero en algún punto del 
perfil, el esfuerzo de corte impuesto por el sismo iguala al esfuerzo 
cedente, haciendo que el material alcance la falla y se produzcan los 
mayores valores de deformación, Figura 5. Simultáneamente ocurre 
el aumento en presión de poros que hace que los esfuerzos efectivos 
disminuyan, al igual que la resistencia al corte del material, y en 
caso de que se iguale el esfuerzo confinante con la presión de poros, 
el esfuerzo confinante efectivo se anula, produciéndose lo que se 
denomina licuación, Figura 6. 
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Figura 4. Esfuerzo de corte impuesto por el sismo vs profundidad 
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Figura 5. Deformaciones de corte vs profundidad 
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Figura 6. Esfuerzo de confinamiento efectivo vs profundidad 


Los resultados anteriormente mostrados se corresponden con 
la salida obtenida con el programa Cyclic 1-D para un perfil de 30 
m de espesor, al aplicar en la base del depósito el sismo ocurrido en 
Chile en el año 1985. En este caso, se produjo licuación inicial desde 
los O m hasta los 23 m, dado que el esfuerzo confinante efectivo se 
anuló para este rango de profundidades (Figura 6). 
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Figura 7. Lazo de histéresis a 20 m de profundidad 
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Para observar si se produjo licuación en el sentido estricto, es 
decir si el suelo experimentó grandes deformaciones bajo estado resi- 
dual de resistencia al corte, con disminución de rigidez y escasa variabi- 
lidad en la presión de poros en el estado licuado (comportamiento con- 
tractivo), se presenta a continuación los lazos de histéresis a 20 m de 
profundidad (Figura 7), la historia de incrementos de presión de poros 
(Figura 8) y la trayectoria de esfuerzos correspondiente (Figura 9). 
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Figura 8. Aumento de presión de poros a 20 m de profundidad 
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Figura 9. Trayectoria de esfuerzos a 20 m de profundidad 
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Se destaca de las figuras anteriores que después de ocurrida 
la licuación inicial, se mantuvo la presión de poros igual al esfuerzo 
confinante, se produjo a los 20 m de profundidad una caída brusca 
en resistencia y rigidez, alcanzando el suelo su estado residual con 
altas deformaciones. 

En la Figura 7 se observa que una vez alcanzada la resistencia 
residual, el material presenta un comportamiento similar al modelo 
elasto-plástico, es decir durante los procesos de carga y descarga, la 
rigidez (pendiente de los lazos de histéresis) tienden a ser constan- 
tes, y resistencia cedente igual a la residual. Este hecho sustenta, 
que en el estado residual, el material aún posee poca resistencia 
y rigidez, es decir, no se produce una rigidez o resistencia al corte 
nula, semejante a la que posee el agua y esto permite que se trans- 
mitan ondas de corte sísmicas hacia la superficie y el material ofrez- 
ca una pequeña resistencia a la deformación. 

En las trayectorias de esfuerzos se observa el comportamiento 
típico de arenas contractivas, es decir la trayectoria de esfuerzos tiende 
a acostarse hacia la izquierda, no mostrando comportamiento parcial- 
mente contractivo o dilatante. Cabe destacar en este punto algunas 
definiciones que han sido convenidas para tratar el tema de licuación: 

Licuación: denota la condición en que el suelo experimenta 
grandes deformaciones bajo un estado residual de resistencia al 
corte, también conocido como falla por flujo, con presión de poros 
igual al esfuerzo confinante. 

Licuación Inicial: denota la condición durante el cual bajo la 
aplicación de esfuerzos de corte cíclico la presión de poros se iguala 
con el esfuerzo confinante. 

Licuación Parcial: denota la condición en que el suelo después 
de alcanzar la licuación inicial y durante subsecuentes ciclos de car- 
ga y descarga se deforma de manera limitada sin alcanzar el estado 
residual, también conocido como movilidad cíclica. 

Numerosos casos han sido reportados en la literatura de daños 
a estructuras debido a licuación de suelos, observándose este fenó- 
meno en sitios donde han ocurrido terremotos, con manifestación de 
volcamiento de edificios, caída de puentes, deslizamiento de presas, 
agrietamiento de pavimentos, tanques que salen a flote a la superfi- 
cie, volcanes de arena, entre otros. Ver Fotos 1, 2, 3, 4 y 5. 
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Foto 1. Volcamiento 
de edificios en Niigata 
(Japón) 1964 [17] 
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Foto 3. Agrietamiento del 
pavimento por licuación de 
arenas [17] 
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Foto 4. Volcamiento de edificio en Foto 5. Asentamiento diferencial 
Turquía por licuación de arenas y en tanque petrolero producto de 
pérdida de capacidad de soporte del licuación de arenas sueltas ante un 
suelo de cimentación [17] evento sísmico [17] 


4.1.Evaluación del Potencial de Licuación 


Para determinar si el estrato granular ubicado entre 0 y 7 m 
de profundidad licuará bajo los escenarios de carga SLE (200 años 
de periodo de retorno) y DLE (1000 años de periodo de retorno) 
se recurrió a los resultados obtenidos del estudio particular de sitio 
obteniendo el valor de CSR con profundidad, el cual resulta de 
dividir el valor equivalente del esfuerzo cortante cíclico máximo 
inducido por el sismo (0.65 tmax) entre el esfuerzo vertical efectivo. 

La comparación entre los valores de CSR y CRR (cyclic resis- 
tance ratio) obtenido de los valores de resistencia de punta del cono 
medido en tres perforaciones realizadas, aplicando la metodología 
de Robertson y Cabal [18], para los suelos granulares, permite 
determinar el Factor de Seguridad contra la licuación definido como: 
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FS = CRR/CSR 

FS: Factor de seguridad contra la licuación 

CRR: Resistencia al corte cíclico. 

CSR: Razón de esfuerzo cíclico inducido por el sismo. 


La representación gráfica de los valores de CSR y CRR, con- 
juntamente con el Factor de Seguridad (FS) con profundidad para el 
estrato granular ubicado entre O y 7 m de profundidad para los esce- 
narios SLE y DLE se muestran en las Figuras 10 y 11 respectivamente. 
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Figura 10. Factor de seguridad contra la licuación 
del estrato granular — Escenario de carga SLE 


Particularmente, bajo el escenario SLE algunos lentes dentro 
del estrato granular licúan (línea marrón por debajo del Factor de 
Seguridad de 1 en la Figura 10) y otros no, sin embargo conserva- 
doramente, se va a considerar para efectos de diseño que todo el 
estrato experimentará licuación. 

Bajo el escenario de carga DLE sucede un comportamiento 
similar al anterior pero abarcando una zona de mayor espesor o 
altura del estrato licuable como se muestra en la Figura 11. 
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LOCACIÓN B - ESCENARIO DLE - ESTRATO GRANULAR 
CSR = (0,65TMAX/ESF EFECTIVO) y CRR 
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Figura 11. Factor de seguridad contra la licuación 
del estrato granular — escenario de carga DLE 


El estrato granular potencialmente licuable degradará su resis- 
tencia al valor de resistencia residual (6 Kpa), que al compararlo con 
el valor de resistencia pico (23 Kpa) resulta un factor de degrada- 
ción de resistencia de 0.26. La degradación de rigidez será de 0.1, 
basado en la medición de pérdida de rigidez, obtenida a partir de 
numerosos ensayos de corte cíclicos realizados en suelos granulares 
que han experimentado licuación [19] y [201. 

Una vez determinadas los estratos potencialmente licuables y 
las variaciones de deformaciones equivalentes con profundidad en los 
demás estratos que componen el perfil litológico, se presentan en las 
tablas 1 y 2 los factores de degradación de rigidez y resistencia en el 
campo libre, con los cuales deberán afectarse las curvas p-y o t-z de 
capacidad portante de pilotes, para tomar en cuenta el efecto de degra- 
dación por carga sísmica en los escenarios SLE y DLE respectivamente. 
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Tabla 1. Factores de degradación de rigidez y resistencia con 


profundidad — Escenario de carga SLE 


Profundidad (m) Degradación de rigidez Degradación de resistencia 


* Licuación del estrato granular 





Tabla 2. Factores de degradación de rigidez y resistencia con 


profundidad — Escenario de carga DLE 


Profundidad (m) Degradación de rigidez Degradación de resistencia 


ICAIC DO ET 


* Licuación del estrato granular 





5. Espectros de Diseño 


Haciendo el estudio particular de sitio o de propagación de 
ondas sísmicas a través de la columna litológica de suelo se han 
obtenido los espectros de respuesta en superficie. En las Figuras 
12 y 13 se muestran los espectros de respuesta para los escenarios 
de carga SLE y DLE, conjuntamente con el espectro derivado del 
estudio de amenaza sísmica para períodos de retorno de 200 años y 
1000 años respectivamente. 
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Figura 12. Espectros de respuesta - Escenario de carga SLE 
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Figura 13. Espectros de respuesta — Escenario de carga DLE 
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Con los espectros de diseño obtenidos de los estudios parti- 
culares de sitio, podrán realizarse análisis dinámicos de las estruc- 
turas utilizando el método de superposición modal en estructuras 
por construir o ya construidas o existentes a fin de cuantificar si se 
amerita o no la implementación de alguna medida de adecuación o 
reforzamiento estructural. 


6. Conclusiones 

En el diseño de estructuras el análisis dinámico es muy impor- 
tante, por cuanto las cimentaciones así como la superestructura van a 
estar sometidas a cargas variables en el tiempo, como son los sísmos. 

El efecto sísmico se ha tratado considerando los escenarios de 
carga Strength Level Earthquake (SLE) y Ductility Level Earthquake 
(DLE), correspondientes a períodos de retorno de 200 años y 1000 
años, respectivamente. 

Para ello y con base en el estudio de amenaza y los paráme- 
tros determinísticos de los posibles sismos que pudiesen ocurrir en 
la zona de estudio, se hace el análisis de propagación de ondas sís- 
micas en el subsuelo para ambos escenarios a fin de determinar los 
valores de esfuerzo y deformación por corte cíclica en campo libre a 
lo largo de todo el perfil litológico. 

Una vez conocidos los valores de esfuerzo y corte cíclicos 
inducidos por el sismo en el campo libre se determinan los niveles 
de movilidad cíclica que se producen en los estratos y la susceptibi- 
lidad de los suelos granulares a la licuación, y como ello afecta los 
valores de rigidez y resistencia de los suelos bajo acción dinámica 
y su influencia en los valores de capacidad por carga axial y lateral 
de pilotes. 

Bajo el análisis particular de sitio, basado en la selección de 
sismos de la red mundial y el estudio de propagación de ondas en el 
subsuelo, conjuntamente con el estudio de amenaza, se presenta el 
espectro de diseño propuesto para períodos de retorno de 200 años 
y 1000 años en la zona de estudio. 

Con los espectros de diseño generados de los estudios particu- 
lares de sitio puede evaluarse cuál es el comportamiento esperado 
de estructuras por construir que se ubican en la cercanía a fallas 
activas o de aquellas estructuras ya construidas a fin de implementar 
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las medidas de adecuación o reforzamiento que sean necesarias para 
que la estructura no colapse aun cuando actúe el sismo más severo. 
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Resumen 


El uso eficiente de recursos en entornos de computación en la Nube es uno entre los 
muchos temas que han atraído a muchos científicos en los últimos años. Hoy en día 
existe una amplia variedad de recursos informáticos disponibles en las infraestructuras 
de Cloud Computing, como CPUs multi-core, GPUs y FPGAs. En particular, arquitectu- 
ras basadas en aceleradores que usan FPGAs pueden proporcionar un importante valor 
agregado de negocio en entornos Cloud. Los dispositivos FPGA ofrecen un mejor des- 
empeño debido a su gran capacidad de procesamiento con latencia predecible y bajo el 
consumo de energía. Sin embargo, la gestión de estos recursos en un entorno Cloud no 
es trivial, y es el foco de este trabajo. En este trabajo, se presenta una arquitectura des- 
tinada a integrar FPGAs como aceleradores en un Cloud privado. La propuesta toma 
en cuenta requisitos de calidad de servicio (QoS). Así, los indicadores de QoS están 
relacionados con los requerimientos de los usuarios. La arquitectura propuesta busca 
la combinación adecuada entre CPUs y FPGAs en un entorno Cloud. 


Palabras clave 


Cloud Computing, energía, FPGA 


Abstract 


The efficient use of resources in cloud computing environments is one of the many topics 
that have attracted many scientists in recent years. Today there is a wide variety of com- 
puting resources available in Cloud Computing infrastructures, such as multi-core CPUs, 
GPUs and FPGAs. In particular, accelerator-based architectures using FPGAs can provide 
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significant business value in Cloud environments. EPGA devices offer better performance 
due to their high processing capacity with predictable latency and low power consumption. 
However, the management of these resources in a Cloud environment is not trivial. In this 
work, an architecture designed to integrate FPGAs as accelerators in a private Cloud is 
presented. The proposal takes into account quality of service (QoS) requirements. Thus, 
the QoS indicators are related to the requirements of the users. The proposed architecture 
seeks the right combination between CPUs and FPGAs in a Cloud environment. 


Keywords 


Cloud Computing, energy, FPGAs 


1. Introducción 


En la actualidad el paradigma de Cloud Computing es un tema 
de gran interés tanto para la academia como para la industria. La 
industria de Cloud representada por los proveedores de servicios 
invierte grandes cantidades de dinero en nuevas infraestructuras 
con el objetivo de satisfacer la creciente demanda de recursos com- 
putacionales. Sin embargo, problemas como por ejemplo: la gestión 
eficiente de recursos, la seguridad, la confidencialidad de la infor- 
mación y el excesivo consumo de energía son cuestiones que aún 
no se han resuelto del todo. Así, la academia es la que se enfoca en 
resolver estos problemas a través de la investigación científica. [1] 

Los entornos Cloud están conformados por dos elementos 
fundamentales, proveedores y clientes. Los proveedores, siendo los 
propietarios de los recursos, buscan maximizar sus ganancias ofre- 
ciendo recursos computacionales como un servicio a bajo coste. Por 
otro lado, los clientes buscan ejecutar sus aplicaciones sin tener que 
incurrir en gastos de manteniendo de infraestructura; dicho en otras 
palabras ellos únicamente buscan pagar por el uso de los recursos. 

La interacción entre estos dos actores sigue un protocolo sim- 
ple. Los clientes envían peticiones a los proveedores para utilizar 
recursos computacionales, los proveedores por su parte luego de 
procesar dichas peticiones seleccionan y encapsulan los recursos 
solicitados en una máquina virtual. Finalmente, el cliente recibe el 
acceso a esta máquina como respuesta a su requerimiento. [2] 

Los proveedores de servicios Cloud son los responsables de ase- 
gurar una calidad de servicio (QoS) en la cual se consideran paráme- 
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tros como: la disponibilidad del servicio, el rendimiento, la latencia, 
etc. [3] Con el objetivo de asegurar a los clientes que estos requeri- 
mientos de calidad se cumplan, clientes y proveedores negocian un 
acuerdo denominado en inglés Service Level Agreement (SLA). [4] 

Clientes y proveedores persiguen diferentes objetivos, por un 
lado, los clientes buscan utilizar recursos computacionales para sus 
aplicaciones con el mínimo costo, mientras los proveedores buscan 
maximizar sus ingresos manteniendo una calidad de servicio ade- 
cuada y disminuyendo sus gastos. Dicho de otra manera, los provee- 
dores buscan ser eficientes en la administración de recursos y el uso 
de la energía. Sin embargo, según estudios publicados por Internet 
World Stats las regiones como África, Latinoamérica y el Caribe han 
mostrado un crecimiento del 7415% y 2029% en los años compren- 
didos entre 2000 y 2016. Como consecuencia, también el coste de 
consumo de energía y disipación de calor se han incrementado de 
manera exponencial. Un ejemplo claro se muestra en [5] donde los 
autores sostienen que el 42% del presupuesto total de los servidores 
de Amazon EC2 se corresponde con la energía tanto en generación 
como en disipación. De hecho, de acuerdo a un estudio realizado 
por McKinsey 8: Company [6] en promedio el 80% de la energía 
utilizada por los grandes centros de datos es únicamente para man- 
tener a estos en estado de reposo y el 20% restante es usado para 
operaciones de cómputo. 

Según un informe realizado por el departamento de Energía 
Lawrence Berkley National Laboratory [7] en el 2016, una estra- 
tegia como el uso de hardware más eficiente podría disminuir el 
consumo de energía en un 45% para el 2020. Este reporte menciona 
que el uso de infraestructura más eficiente en almacenamiento, red 
y procesamiento el fundamental para disminuir el excesivo consumo 
de energía de los grandes centros de datos. 

Desde la industria, los principales proveedores de Cloud 
como Google, Amazon han optado como estrategia la utilización de 
infraestructuras más eficientes como el uso de dispositivos FPGA 
[8]. Como resultado han logrado reducir el consumo de energía. 
Además, han trasladado sus infraestructuras a lugares con bajas 
temperaturas, para disminuir el consumo de energía que se utiliza 
para enfriar sus granjas de servidores. 
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Como se explicó anteriormente es muy importante establecer 
una arquitectura que permita por un lado satisfacer la creciente deman- 
da de recursos pero al mismo tiempo contralar el consumo de energía. 

Este trabajo propone una arquitectura que aborda la integra- 
ción de hardware eficiente como FPGAs dentro de un paradigma de 
Cloud Computing. La propuesta se enfoca en la gestión de recursos 
heterogéneos que incluyen el uso de FPGAs como aceleradores de 
código en la ejecución de tareas en un entorno de Cloud privado. 

Las principales contribuciones de este artículo son: una revisión 
de la literatura enfocada en la integración y gestión de FPGAs dentro 
de entornos Cloud y el desarrollo teórico de una arquitectura que ten- 
ga como objetivo la integración de FPGAs en un Cloud privado. Final- 
mente, una evaluación como prueba de concepto de la propuesta. 

El artículo se encuentra organizado de la siguiente manera, en 
la Sección 2 se muestra una revisión de los conceptos teóricos que 
soportan la propuesta. En la Sección 3, se exponen los principales 
trabajos relacionados con nuestra propuesta. En la sección 4, se dan 
detalles sobre la implementación y funcionamiento de la propuesta. 
En la sección 5 se muestra una evaluación como prueba de concepto 
de la arquitectura. Finalmente, en el capítulo 6 se discuten algunas 
conclusiones de este trabajo. 


2. Marco teórico 


A. Arquitectura Cloud 


Desde el punto de vista de la computación distribuida, el 
paradigma de Cloud sigue una arquitectura por capas. Las tres 
principales capas son: la capa de plataforma de gestión, la capa de 
virtuzalización y la capa de hardware como se puede observar en la 
Figura 1. [9] 

La capa de hardware está compuesta por un grupo de recur- 
sos tales como: servidores, dispositivos de red, fuentes de energía, 
sistemas de ventilación y disipación de calor. Además, cabe destacar 
que cada servidor se encuentra compuesto, por lo menos, por proce- 
sadores, memoria, discos de almacenamiento y tarjetas de red. Tam- 
bién se pueden encontrar dispositivos especiales como por ejemplo 
co-procesadores, procesadores gráficos (GPUs), FPGAs, etc. 
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La capa de virtualización usa máquinas virtuales para partir 
los recursos computacionales disponibles y así facilitar su comparti- 
ción y gestión. La virtualización permite crear un entorno virtual de 
manera segura y asilada con el objetivo de ejecutar una aplicación o 
un grupo de aplicaciones determinadas. 

Desde el punto de vista de Cloud, los proveedores de servicio 
necesitan encontrar mecanismos para realizar una gestión eficiente 
y segura de los recursos computacionales. Y además, asegurar que 
dicho mecanismo sea capaz de escalar. 

Los proveedores utilizan la virtualización para entregar servi- 
cios y/o desplegar servicios a los clientes de manera rápida y segura. 
A pesar de que el término de virtualización sea comúnmente relacio- 
nado con la emulación de un hardware, esta tecnología es muy útil 
para la compartición y gestión de recursos en un centro de datos. 
El mecanismo de gestión, a nivel macro se lo realiza a través de un 
software conocido como Gestor de Virtualización en inglés Virtual 
Machine Manager VMM. Existen diferentes tipos de VMMs, los más 
usados en entornos Unix son: KVM (Kernel-based Virtual Machine) 
y XEN, mientras que para los sistemas que se ejecutan en Windows 
se tiene Hyper-V y VMware vSphere. [10] 

A pesar de las ventajas para la gestión, aislamiento y seguridad 
que ofrece la virtualización, esta tecnología presenta un sobrecoste en 
el rendimiento del sistema debido a que el VMM debe multiplexar los 
procesos del sistema operativo local y los procesos del sistema ope- 
rativo simulado. Sin embargo, existen técnicas como por ejemplo la 
paravirtualización que ayuda a reducir este sobrecoste de rendimiento. 

Finalmente, grandes empresas tecnológicas como Intel y AMD 
han desarrollado extensiones para mejorar el rendimiento de entor- 
nos virtuales. En particular, Intel VT-x [11] y AMD SVM [12]. Estos 
mecanismos permiten acelerar los entornos virtuales a través de 
funciones especiales y la gestión de memoria. 

La última capa denominada plataforma opera a nivel de nodo 
de un servidor y se encarga de gestionar las distintas máquinas vir- 
tuales desplegadas en diferentes nodos de un centro de datos. 

Esta capa está compuesta por un software que tiene la capa- 
cidad de conocer todos los recursos disponibles de varios nodos en 
un entorno Cloud. Además, esta capa es capaz de desplegar, moni- 
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torizar y gestionar una gran cantidad de máquinas virtuales desple- 
gadas en la capa de virtualización. Dicho de otro modo, esta capa 
es la responsable de dirigir de manera efectiva la creación, monito- 
rización, gestión, despliegue de toda la infraestructura virtual en un 
entorno de Cloud. 

En la actualidad tanto en la academia como en la industria 
los VMMs más usados en entornos de Cloud son: Open Stack [13], 
Eucalyptus, VMware y Open Nébula [14]. Cada uno de estos contie- 
ne una seria de características que los investigadores aprovechan en 
base a sus necesidades. 

En el siguiente apartado se detallan, aspectos sobre el para- 
digma de Cloud Computing basado en tecnologías de virtualización. 


Virtual Machine Manager 


Platform 
layer 





Virtualization 
layer 


layer 


Figura 1. Arquitectura de Cloud Computing 








B. Definición y modelos de despliegue en Cloud 


De acuerdo con el Instituto Nacional de Estándares y Tecno- 
logía en inglés Nation Institute of Standars and Technology (NIST) 
[15], Cloud Computing es “un modelo ubicuo bajo demanda que 
comparte recursos computacionales (red, servidores, almacenamien- 
to, aplicaciones y servicios) que pueden ser rápidamente provistos 
y liberados con una gestión mínima por parte de los proveedores.” 

Según la definición anterior Cloud Computing presenta una 
serie de caracterizas tales como: 

e Bajo-demanda.- los proveedores de servicios Cloud permiten 
auto-aprovisionamiento de recursos de manera autónoma. 
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e Acceso ubicuo.- el acceso a los servicios de Cloud es a través 
de Internet. 

e  Multi-usuario.- los recursos en Cloud son compartidos por un 
sin número de usuarios de manera transparente y eficiente. 

e Elástico y escalable.- Cloud tiene la capacidad de adicionar y 
liberar recursos de manera dinámica de acuerdo a los requeri- 
mientos de los clientes. 

e Monitorización de uso de recursos.- para controlar, optimi- 
zar y con fines de facturación, las arquitecturas Cloud ofrecen 
herramientas para la monitorización del uso de recursos. 


Por otro lado, el paradigma de Cloud ofrece tres tipos modelo 
de entrega de servicios que son: Software-como-un-Servicio (SaaS), 
Plataforma-como-un-Servicio (PaaS) e Infraestructura-como-un-Ser- 
vicio (laaS). 


cloud provider 


inn Mad o YN 








Pi ¿Y A 


4 laaS Cloud Service Contract 
Product: Virtual Server, 312GB RAM, 4GB local storage 
SLA: avalability=99.5%, no failover 
Price: $0,95 per hour, $0.05 per GB transierred out of cloud 


Figura 2. Infraestructura como servicio (laaS) [3] 
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Y, SaaS Cloud Service Contract 
Y, SLA: response time=0.5ms 

Y Price: $0.05 per 100 requests 
Figura 3 Software como servicio (SaaS) [3] 


ready-made 
environment 








Figura 4. Plataforma como servicio (PaaS) [3] 
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En el modelo de laaS como se muestra en la Figura 2, los 
proveedores ofrecen a sus clientes recursos computacionales (pro- 
cesamiento, servicios de red, almacenamiento) encapsulados en 
una máquina virtual, por ejemplo: Amazon Web Service, Microsoft 
Azure, Google Cloud, Rackspace, etc. 

En el caso de Saas (ver Figura 3), los proveedores ofrecen a 
sus clientes una lista de aplicaciones que están en el Cloud, algunos 
ejemplos son: Twitter, Facebook, Flickr, Google Docs. 

Finalmente en la Figura 4, se muestra el modelo PaaS. En este 
modelo, se ofrecen plataformas para el desarrollo de aplicaciones, 
como por ejemplo: Amazon Web Service (AWS), Windows Azure, 
Google App Engine. 

Finalmente, todos estos servicios de Cloud mencionados ante- 
riormente pueden ser desplegados en entornos Privados, Públicos, 
Comunitarios e Híbridos. A continuación se da un breve resumen de 
los distintos modelos de despliegue de Cloud. 

La Figura 5 muestra el despliegue en un entorno privado, cuya 
principal característica es que los recursos solamente pueden ser 
accedidos por los miembros de la misma organización. 

private cloud 


Y "o e 


Y 








organizabon 


Figura 5. Ejemplo de un Cloud Privado [3] 
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Por otro lado, la Figura 6 muestra la arquitectura para un 
modelo de Cloud Público en el cual los recursos computacionales se 
ofrecen al público en general a través de Internet. 





Figura 6. Ejemplo de Cloud Público [3] 


Finalmente, la Figura 7 muestra un modelo que combina dos 
o más de los modelos mencionados anteriormente. 
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public cloud 





private cloud 





di 








organization 


Figura 7. Ejemplo de un Cloud Hibrido [3] 


C. Calidad de Servicio (QoS) y asignación de recursos en Cloud 


En la sección anterior se mencionaron la definición de un 
Cloud y los modelos servicio y despliegue. En esta sección nos refe- 
riremos a conceptos fundamentales de calidad de servicio y las dife- 
rentes técnicas usadas para la gestión de recursos en Cloud. 

Los entornos Cloud ofrecen a sus clientes una gran cantidad 
de recursos disponibles bajo demanda siguiendo un modelo pay-as- 
you-g0, pago por lo que uso [16]. Desde el lado del proveedor, los 
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servicios tienen cumplir con una cierta calidad. Estos parámetros de 
calidad tales como: rendimiento, latencia, disponibilidad son inclui- 
dos dentro del Acuerdo de Nivel de Servicio (SLA) [17]. 

La calidad del servicio en Cloud está estrechamente relaciona- 
da a la gestión de recursos del sistema. Una gestión eficiente permite 
a los proveedores aprovechar al máximo sus infraestructuras. Sin 
embargo, debido a la complejidad que presenta un Cloud, esta tarea 
no es trivial. Uno de los problemas más abordados es la asignación 
eficiente de recursos. 

La asignación de recursos es una tarea que debe ser realizada 
de manera autónoma y bajo demanda. Por lo general se definen dis- 
tintas políticas para llevar esta tarea. Las políticas más usadas para la 
asignación de recursos en Cloud incluyen, el control de admisión, la 
eficiencia energética, los modelos estadísticos, el balanceo de carga, 
criterios de SLA y el uso de dispositivos dedicados como FPGAs. [18] 

La política de control de admisión es preventiva y su objetivo 
es evitar la sobrecarga de recursos y violaciones del SLA. Esta políti- 
ca se basa en la relación entre el conocimiento previo acera del com- 
portamiento del sistema y la carga [19]. Esta política puede resultar 
muy compleja para entornos muy dinámicos y puede causar una 
sub-utilización del sistema. Sin embargo, trabajos [20], demuestran 
que la combinación de estas políticas con criterios sobre aprovisio- 
namiento (Over-booking) suelen dar un mejor rendimiento. 

Por otro lado, las políticas basadas en eficiencia energética y 
modelos estadísticos buscan un balance entre la asignación de recur- 
sos, mantener una tasa aceptable de SLAs cumplidos y disminuir el 
consumo de energía. Proyectos como TANGO [21], se enfocan en 
la implementación de algoritmos de eficiencia energética orientado 
a computación de alto rendimiento. Trabajos como [5], [22], [23], 
usan algoritmos que consideran el consumo de energía. 

Las políticas que consideran el balanceo de carga tienen como 
objetivo distribuir la carga a través de los recursos disponibles del 
sistema. Estas políticas integran criterios de migración de tareas 
a diferentes recursos dependiendo de la carga. Por ejemplo, si el 
sistema detecta que un nodo se encuentra subutilizado y otro sobre- 
utilizado, el sistema se encarga de migrar las tareas desde el nodo 
sobreutilizado al nodo subutilizado, de tal manera que se consiga un 
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equilibrio. Sin embargo, la migración de tareas podría provocar una 
saturación de la red. [18] 

Las políticas que toman en cuenta los SLAs [19] se enfocan en 
mapear el requerimiento de cada uno de los clientes y los recursos 
disponibles que pueden satisfacer el SLA. Por lo general se basan en 
algoritmos que realizan predicciones y toma de decisiones relacio- 
nados con la Inteligencia Artificial. 

Finalmente, las políticas relacionadas con la utilización de 
dispositivos más eficientes son nuevas en el ámbito de Cloud. En 
este tipo de mecanismo las peticiones de los clientes son clasificadas 
en diferentes categorías dependiendo de los requerimientos para 
después ser asignadas a los recursos que mejor se adapten. Además, 
estos recursos poseen características muy favorables con respecto 
al uso de la energía y rendimiento. Sin embargo, es una tarea muy 
compleja encontrar los mejores recursos para todas las tareas por lo 
cual se puede tener algunos recursos subutilizados. 


D. Técnicas de Planificación de recursos en Cloud 


Desde el punto de vista de la industria las técnicas de planifi- 
cación de recursos son utilizadas para maximizar los ingresos de los 
proveedores y reducir el tiempo de retorno de la inversión (ROT). El 
mecanismo más utilizado para conseguir este objetivo es compartir 
de manera eficiente los recursos computacionales disponibles. Sin 
embargo, esta tarea no es trivial debido a la gran variabilidad que 
presentan los entornos de Cloud. Según [24], la clave para conse- 
guir el objetivo antes mencionado está en diseñar un sistema de 
planificación que sea eficiente, lo suficientemente justo e inteligente 
con la mínima interacción humana. 

De manera general algunos mecanismos para la gestión se basan 
en sistemas de colas con prioridades para determinar ¿Qué recurso? 
va a ¿Dónde? y ¿Cuándo? Esta estrategia básicamente elabora listas 
dinámicas y ordena sus elementos según un criterio de prioridad. 

Las técnicas de planificación de recursos se pueden imple- 
mentar siguiendo una arquitectura por capas. Así, cada capa es res- 
ponsable únicamente de una función específica. Por ejemplo: en un 
esquema de planificación con tres capas: Aplicación, Virtualización y 
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Despliegue. La primera capa es la responsable de clasificar las peti- 
ciones de los clientes de acuerdo a una determinada política como 
QoS. La segunda capa es responsable, por su parte, por su parte de 
gestionar los recursos virtualizados haciendo un mapeo entre los 
recursos físicos y los virtuales. Finalmente, la última capa es respon- 
sable de repartir las tareas a diferentes nodos del Cloud. 

La planificación de recursos puede ser vista como un proble- 
ma de optimización multiobjetivo. Por un lado minimizar el coste y 
maximizar la utilización de los recursos en el tiempo. 

En [25], los autores clasifican las estrategias de planificación de 
recursos en aquellas que consideran el rendimiento (performance) y 
en las que consideran el coste. Las estrategias que consideran el ren- 
dimiento se dividen en First-come First-serve (primero en llegar es el 
primero en ser atendido), balanceadores de carga. Por otro las estrate- 
glas que toman en cuenta el coste se dividen en máximo rendimiento, 
mínimo coste de operación y la combinación de las dos. 

A continuación se hace una revisión de trabajos relacionados 
con la integración, gestión y planificación de recursos como FPGASs 
dentro de entornos Cloud. 


3. Trabajos relacionados 


A. Recursos heterogéneos en Cloud 


Existen diferentes tipos de clientes que usan los recursos de 
Cloud como por ejemplo, científicos, desarrolladores, investigadores 
etc. Todos ellos, necesitan un conjunto de recursos específicos crean- 
do una demanda muy variada. Esta diversidad de clientes demanda 
también una amplia gama de servicios también muy diversa. Así, 
los proveedores deben adaptarse a través de la adquisición de más 
y diversa infraestructura. Sin embargo, el hardware está limitado a 
factores como la densidad de potencia [W/mm”] y la complejidad. 
La diversidad obliga a los proveedores en integrar arquitecturas hete- 
rogéneas. La integración de recursos heterogéneos puede ayudar a 
mejorar la eficiencia en el uso de los recursos a través de un mapeo 
de las necesidades de los clientes con los recursos más adecuados que 
contienen caracterizas específicas muy favorables para satisfacer un 
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SLA. Estas características pueden ser, por ejemplo, un mejor desem- 
peño en el procesamiento gráfico mediante el uso de GPUs, procesa- 
dores usados como aceleradores de código incluso hardware dedicado 
para ciertas tareas específicas mediante el uso de FPGAs. 


B. FPGAs en Cloud 


Los dispositivos de hardware FPGA usados como coprocesado- 
res ofrecen una mejora significativa para muchas aplicaciones [26]. 
Así, existen algunos esfuerzos para integrar FPGAs dentro de ámbito 
tradicional de las aplicaciones informáticas. Algunas soluciones han 
sido proporcionadas por la industria, tal como PicoComputing, Con- 
vey y Xillybus [27]. Estos productos conectan aplicaciones informá- 
ticas con la FPGA a través de una interfaz propietaria desarrollada 
bajo sus protocolos propios. Mitrion-C, Open Bio Project [28] inten- 
tan acelerar aplicaciones bioinformáticas portando secciones críticas 
de sus aplicaciones hacia FPGAs. 

Por otro lado, arquitecturas de código abierto como RIFFA 
[29] proporcionan una plataforma muy práctica para usar dispo- 
sitivos FPGA de Xilinx como aceleradores de código. Sin embargo, 
estos ejemplos no disponen de una arquitectura para desarrollar 
aplicaciones paralelas y distribuidas que usen múltiples nodos inter- 
conectados entre sí. 

En otros trabajos los dispositivos FPGAs son utilizados sola- 
mente como elementos computacionales formando un clúster[30]. 
Sin embargo, no todas las aplicaciones pueden ser aceleradas de 
forma efectiva usando FPGAs. Por ejemplo, para aplicaciones basa- 
das en operaciones con números de coma flotante o aplicaciones que 
requieren una frecuencia de reloj elevada, los procesadores gráficos 
GPUs son más eficaces como aceleradores de código. 

El uso de GPUs como recursos computacionales dentro de 
infraestructuras de Cloud ha surgido en los últimos años. Por lo tan- 
to, hoy en día algunas compañías ofrecen los servicios de GPU a sus 
clientes. Por ejemplo, Amazon EC2 [8] soporta el uso de GPUs para 
flujos de trabajo diseñados bajo CUDA y OpenCL [31]. 

El uso de FPGAs en sistemas Cloud cada vez va tenido mucho 
éxito. Así, empresas como Nimbix [32] ofrecen un sistema de pago 


Diseño de una arquitectura heterogénea para la gestión eficiente de recursos FPGA en un cloud privado 


en la nube con una variedad de plataformas para aceleración de 
código. Recientemente, esta compañía ha lanzado JARVICE, que es 
una plataforma que incluye la disponibilidad GPUs, DPS y FPGAs 
para un Catálogo de aplicaciones y además una API o un acceso para 
enviar tareas a través de una línea de comandos. 

Por otra parte, hay algunos trabajos que combinan acelera- 
dores (FPGAs, GPUs) y CPUs dentro de nodos en un clúster como 
AXEL, AXEL combina nodos heterogéneos con el modelo de progra- 
mación MapReduce obteniendo como resultado una plataforma de 
computación de alto rendimiento y de bajo coste. En este trabajo el 
autor destaca que el mayor inconveniente es la dificultad de imple- 
mentación de los diseños dentro de las FPGAs en comparación con 
la programación que ofrece por ejemplo CUDA para GPUs. Además, 
investigaciones recientes destacan el uso de la reconfiguración 
dinámica de los nuevos modelos de FPGAs. Por ejemplo en [33] se 
presenta un servicio de reconfiguración. Este servicio está basado en 
la administración eficiente de la funcionalidad de la reconfiguración 
parcial de dispositivos FPGAs, obteniendo así una gran disminución 
en el tiempo de configuración del dispositivo y optimizando al máxi- 
mo el uso de recursos. 

La investigación que más se acerca a nuestra visión es el pro- 
yecto Europeo FP7 HARNESS (Hardware and Network Enhanced 
Software Systems for Cloud Computing) Proyecto Europeo FP7. El 
objetivo de este proyecto es desarrollar una plataforma mejorada 
con acceso a una variedad de recursos computacionales, de comu- 
nicación y de almacenamiento. La plataforma consiste en una serie 
de componentes que pueden tener múltiples implementaciones. A 
continuación, una aplicación puede ser desplegada de diferentes 
maneras sobre los recursos obteniendo costos diferentes, mayor 
rendimiento y características de uso. Sin embargo, en este trabajo 
se enfoca como una extensión de los trabajos antes mencionados en 
el cual se toma en cuenta la eficiencia energética. 


C. FPGAs en lIaas 


Existen algunos trabajos en los cuales se integran FPGAs den- 
tro de entornos Cloud para ofrecer estos como un servicio. En [34] 
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los autores proponen una arquitectura para proveer FPGAs como 
servicio en el Cloud de IBM. Esta propuesta está implementada 
sobre el gestor de Cloud OpenStack [13] y su característica principal 
es el uso de la reconfiguración parcial. La reconfiguración parcial 
es una característica de las FPGAs modernas y permite compartir 
dividir el hardware para ser utilizado por varios usuarios de manera 
simultánea. Existen trabajos similares a este en los cuales se ofrece 
FPGAs como parte de una arquitectura genérica a través de una 
extensión del gestor OpenStack [13]. 

En [35] se propone un hypervisor para la integración de 
FPGAs virtuales. En este trabajo el hypervisor tiene acceso a una 
base de datos que contiene la información de los dispositivos FPGA 
y este se encarga de su gestión e base a la demanda de los clientes. 

Todos estos trabajos [36], [37], [38] se enfocan en ofrecer 
recursos FPGA como un servicio. 

Desde el punto de vista de ofrecer software como un servicio 
(SaaS), el uso de FPGAs como aceleradores de código a tomando 
importancia recientemente. En 2014, Microsoft lanzó su proyecto 
Catapult [39], el cual se enfocó en acelerar con FPGASs el algoritmo 
Page-rank usado para búsquedas en Bing. Los resultados obtenidos 
fueron de alrededor de 95% en el rendimiento usando únicamente 
22.7 [W] adicionales. 

En otro trabajo los autores modificaron la arquitectura de Apa- 
che Hadoop [40] para incluir el uso de FPGAs como aceleradores de 
código. En este trabajo se utilizaron las FPGAs en conjunto con nodos 
workers. En un trabajo similar [41], se utilizaron FPGAs para acelerar 
los algoritmos tanto de los nodos mappers como reducers. En este 
trabajo la estrategia de gestión de recursos se realizó mediante el uso 
de un sistema multicolas para la asignación de tareas. 

En [41], se utilizan FPGAs para acelerar algoritmos de Machi- 
ne Learning como: K-means, Naive Bayes, k-Nearest Neighbours, 
Support Vector Machine (SVM). Los resultados indican que en pro- 
medio la arquitectura con FPGAs puede alcanzar una aceleración de 
2.27X y con un consumo menor de 3.7x. 

Existen también productos comerciales enfocados a la acelera- 
ción de aplicaciones en Cloud como por ejemplo Ryft3. 
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Este producto puede alcanzar una aceleración de hasta 100x y 
una reducción de energía total de 70%. 

A continuación se expone la arquitectura propuesta para una 
integración eficiente de FPGAs dentro de un entorno de Cloud Com- 
puting privado. 


4. Arquitectura propuesta 


En esta sección se describe una arquitectura heterogénea para la 
construcción de servicios de infraestructura bajo demanda en los siste- 
mas de Cloud Computing basada en [37], [36]. La arquitectura intenta 
abordar los desafíos de despliegue de una infraestructura como servicio 
(laaS) en un centro de datos privado, en el que los dispositivos FPGA 
son considerados como recursos computacionales virtuales. 

Las FPGASs virtuales son elementos computacionales adminis- 
trados por el sistema junto con las máquinas virtuales que se eje- 
cutan en los distintos procesadores (CPUs). Para ser más precisos, 
los dispositivos FPGA son usados como aceleradores en la ejecución 
de aplicaciones. En el resto de la sección se describe las principales 
características de la arquitectura que proponemos. Antes de explicar 
la propuesta, es muy importante mencionar que cada nodo se com- 
pone de al menos una CPU, y que pueden incluirse algunos elemen- 
tos COTS extra. La CPU es la encargada de controlar el acceso y la 
asignación de tareas a los aceleradores. Por lo tanto, hace falta una 
conexión física entre la máquina virtual y los elementos de acelera- 
ción de hardware. Se propone usar el bus de datos PCI exprés ya 
que este es el que proporciona el mejor rendimiento en cuanto a la 
cantidad de datos que se pueden enviar/recibir por unidad de tiem- 
po. Además cabe destacar que para mejorar aún más el intercambio 
de datos entre máquinas virtuales y hardware de aceleración pre- 
tendemos usar la tecnología de virtualización que proporciona Intel 
VEd [11]. Esta tecnología permite que los dispositivos de hardware 
accedan de manera directa a las máquinas virtuales, reduciendo el 
tiempo de inactividad y aumentando el rendimiento productivo por 
una mejor utilización de los recursos del centro de datos. 

La mayoría de los entornos Cloud utilizan un software de 
administración de máquinas virtuales conocido como Virtual Machi- 
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ne Manager (VMM). Este elemento es el encargado de preparar, 
desplegar y monitorizar todos los recursos virtuales en un entorno 
Cloud. La arquitectura propuesta está desarrollada sobre el gestor 
VMM y permite utilizar las funcionalidades de este elemento y ade- 
más extender dichas funcionalidades a la explotación de elementos 
de hardware adicionales como FPGAs o GPUs. Para ello se ha dise- 
nado dos módulos principales, que son: Administrador de Hardware 
de Aceleración (HAM, por sus siglas en ingles) y una base de datos 
que hemos denominado Catálogo de Aplicaciones (Catalog) como se 
muestra en la Figura 8. 

HAM es el cerebro de la arquitectura y se encarga de buscar 
recursos disponibles, además de preparar, desplegar y controlar la 
infraestructura virtual. Mientras que el segundo elemento es el encar- 
gado de guardar y actualizar la información sobre la disponibilidad y 
el estado de los recursos de todo el sistema. HAM usa las herramien- 
tas del administrador de máquinas virtuales para realizar acciones 
como: consulta de recursos, despliegue de nuevas máquinas virtuales, 
conectar una máquina virtual con un acelerador de hardware, etc. 





Figura 8. Modelo de arquitectura propuesta [37] 
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El Catálogo, por otra parte, almacena la información sobre los 
recursos, como por ejemplo número de procesadores de cada nodo, 
identificación de dispositivos de aceleración, ficheros de aplicacio- 
nes (Bitstreams) disponibles para ser usados por estos dispositivos. 
Además, mantiene actualizada esta información para su uso futuro. 

Como se puede observar en la Figura 9, HAM está compuesto 
por cuatro controladores: Controlador de Catálogo (CC), Controlador 
de Infraestructura Virtual (VIC), Controlador Bitstreams (BC) y final- 
mente un Controlador de Tareas (JMC), cada uno de ellos tiene una 
funcionalidad especifica que vamos a explicar a continuación. 

El Controlador de Infraestructura Virtual (VIC) utiliza las funcio- 
nes del administrador de máquinas virtuales para desplegar máquinas 
virtuales en los distintos nodos. Además, es el encargado de vincular 
cada máquina virtual con el hardware de aceleración respectivo. 

El segundo elemento es el Controlador de Bitstreams (BO), 
este módulo ofrece dos funciones: 


a) se encarga de transferir el fichero bitstream desde el servidor 
hasta el cliente a través de una conexión SSH. 

b) es la encargada de configurar o programar el hardware FPGA 
usando las herramientas del fabricante. 


Otro elemento fundamental es el Controlador de Tareas (JMC), 
este módulo tiene la función de monitorizar el estado de una ejecu- 
ción de una tarea, es decir, este módulo es una especie de demonio 
que se encarga de comunicar al sistema cuando la ejecución de una 
tarea ha cambiado de estado. 

Finalmente, el último módulo es el encargado de interactuar 
con el Catálogo (CC), este elemento se comunica con el Catálogo 
a través de operaciones de lectura y escritura. El Controlador del 
Catálogo mantiene actualizada la información de los recursos del 
sistema de tal manera que el administrador puede hacer uso de esta 
información cada vez que reciba una solicitud por parte del usuario 
o del propio sistema. 
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Figura 9. Gestor de aceleración de hardware [37] 


A continuación se va a explicar los detalles de funcionamiento del 
sistema. Para ello, se ha dividido el proceso en tres fases. En la primera 
fase O puesta en marcha del sistema, el Controlador de Catálogo se pone 
en funcionamiento, consultando toda la información sobre los recursos 
disponibles (paso 1) en ese momento, como se puede ver en la Figura 
10. Esta información es recolectada y enviada al Catálogo. Una vez con 
esta información (paso 2), el sistema se pone en modo de espera de 
peticiones. En este modo, el servidor se encuentra a la espera de llegada 
de una petición por parte del usuario o del propio sistema. 
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Figura 10. Controlador de bitstream [36] 
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La segunda fase inicia con una petición por parte del usua- 
rio. Esta petición se procesa por el Controlador de Infraestructura 
Virtual (VIC). Este controlador en primera instancia revisa si la 
solicitud esta correcta y completa (pasos 1 y 2). Los elementos que 
conforman esta solicitud son datos sobre la máquina virtual, como 
identificación, una imagen del sistema operativo que se pretende 
desplegar y la posibilidad de vincular esta máquina virtual con un 
hardware de aceleración (pasos 6, 7 y 8), como se puede observar 
en la Figura 11. Si toda esta información está completa y es correcta, 
se acepta la solicitud y se despliega el software virtual respectivo; en 
caso contrario, se muestra un mensaje de error. 


EJES A EE 





Figura 11. Controlador de infraestructura Virtual [36] 


La arquitectura también pretende proporcionar la opción de 
que el administrador pueda agregar más imágenes o elementos adi- 
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cionales al Catálogo como recursos al sistema. Finalmente, una vez 
que tenemos a nuestra disposición el software virtual desplegado 
(máquinas virtuales) (pasos 9, 10 y 11) el siguiente paso es preparar 
el hardware de aceleración. Para ello el sistema realiza los pasos deta- 
llados a continuación: El Controlador de Catálogo revisa si dispone de 
la aplicación (pasos 1 y 2), los ficheros bitstream en el caso de FPGA 
o de la aplicación en el caso de GPU como se muestra en la Figura 
12. Si se dispone de la aplicación, el Catálogo pone a disposición del 
Controlador de Bitstreams el fichero (bitstream). Este elemento es 
transferido y/o configurado para ser utilizado como acelerador (pasos 
3, 4 y 5). Una vez que todo este proceso se haya realizado correcta- 
mente, el sistema está listo para ser explotado por el usuario (paso 6). 


costos | | wm ] [005 ] [wm | [ea | 
| l 








a 


| 
| 
| 
Figura 12. Configuración de bitstreams [36] 


En el caso de que no se disponga de la aplicación en el Catálogo, 
el usuario tiene la posibilidad de subir su propio fichero al Catálogo. 
Por último, hay que mencionar que cuando el usuario haya terminado 
de usar los recursos virtuales, estos serán liberados del sistema. 
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B. Estrategia de gestión de recursos 


La estrategia de asignación se implementa dentro del Contro- 
lador de Infraestructura Virtual, y se describe en la Figura 11. Se 
usa un método de aprendizaje supervisado para estimar el uso del 
tiempo de una solicitud de servicio particular, en base a los datos 
anteriores, es decir, los datos de entrenamiento. 

El servicio VIC lleva a cabo dos etapas: 


1. Implementa un modelo de predicción que aprovechan la infor- 

mación almacenado en el Catálogo. Tenga en cuenta que en 
nuestro sistema los usuarios no necesitan tener conocimiento 
previo de la duración real del servicio, por lo que el tiempo de 
finalización debe estimarse en este punto. 
Los datos de entrada se refieren a la complejidad del software 
(por ejemplo, la cantidad de los datos a procesar), y el resultado 
es el tiempo de procesamiento esperado en un recurso de pro- 
cesamiento específico. Por lo tanto, este modelo se usa directa- 
mente por el sistema para hacer predicciones sobre el tiempo de 
ejecución esperado para las nuevas solicitudes enviadas. 

2. El clasificador toma una decisión sobre qué tipo de se necesi- 
tan recursos para cumplir con la solicitud de servicio basado 
en la estimación de tiempo de ejecución total, incluyendo el 
momento de implementar la infraestructura virtual () y los 
parámetros de QoS establecidos en la solicitud de servicio. 
Por lo tanto, la solicitud de servicio puede se clasifica para ser 
ejecutado dentro de un elemento de procesamiento estándar 
(CPU) o con la cooperación de hardware de aceleración FPGA. 


El objetivo principal de esta estrategia de asignación es evi- 
tar la violación de SLA utilizando elementos de proceso estándar y 
elementos de proceso muy rápidos como aceleradores trabajando 
juntos, al programar su uso en un “inteligente” camino. 

Considere un ejemplo simple en donde una solicitud de ser- 
vicio, como una Transformada de Fourier para 1024 Gb de datos, 
se envía al sistema. Supongamos también que no hay hardware de 
aceleración disponible. Entonces, el clasificador estima el tiempo 
necesario para completar esta solicitud usando un modelo de regre- 
sión lineal. Como posible escenario, el cliente define un tiempo para 
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usar el software como un servicio, pero el sistema puede estimar que 
el tiempo definido por el usuario no es suficiente para completar la 
solicitud si únicamente se ejecuta en CPUs convencionales. En ese 
caso, si la solicitud es aceptada, una violación de los niveles de servi- 
cio especificados se produciría. Sin embargo, cuando el sistema sabe 
que tiene hardware de aceleración, el servicio VIC clasificaría esta 
solicitud para programarse en el conjunto de recursos con hardware 
de aceleración CPU+FPGA. De esta manera, los niveles de servicio 
solicitados se cumplirían. Como efecto secundario, y en el caso par- 
ticular de FPGA como aceleradores, existen ventajas adicionales, 
como el menor consumo de energía. 

Una vez que la solicitud de servicio ha sido clasificada para su 
ejecución, el JMC debe buscar un espacio libre dentro del conjunto 
adecuado de recursos para ejecutar la solicitud de servicio, y dentro del 
tiempo intervalo establecido en la solicitud de servicio. Para tal fin, se 
pueden aplicar varios criterios de búsqueda, como First-Fit o incluso del 
que mejor ajuste (es decir, programar la solicitud en el primer espacio 
libre el tiempo suficiente para cumplir la solicitud). La solicitud dentro 
del intervalo de tiempo especificado por el usuario, o en la ranura cuya 
duración mejor se ajusta al tiempo estimado de ejecución del servicio. 
Criterios adicionales pueden incluye tratar de minimizar el número de 
ejecuciones VMs para minimizar el consumo de energía. 

En esta propuesta se considera el algoritmo First-Fit como cri- 
terio de asignación de recursos. Esto implica el uso de la estimación 
calculada en el módulo JMC. Esto se hace para elegir el recurso más 
adecuado para asistir a la solicitud actual, evitando así el desperdi- 
cio de uso de recursos (es decir, cuando el usuario ha especificado 
un tiempo marco para la ejecución del servicio mucho más grande 
que el real tiempo de ejecución esperado). Además, el tiempo de 
implementación también son considerados en esta propuesta. Este 
tiempo considera las acciones de iniciar la máquina virtual con los 
parámetros tales como imágenes, memoria, software, y controlado- 
res previamente definidos (ver Figura 14). 


5. Evaluación 


El enfoque descrito en secciones anteriores ha sido implemen- 
tado en un entorno privado real heterogéneo en la Universidad de 
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Castilla La Mancha (España) [37], en el cual se ha incluido una 
FPGA. El objetivo de esta evaluación es realizar una prueba de 
concepto de la arquitectura propuesta. Además, los experimentos 
también se han diseñado para garantizar la repetitividad. 

Para comparar el impacto de agregar hardware como dispositi- 
vos de aceleración de aplicaciones hemos dividido estos experimentos 
en dos escenarios. Por un lado, un escenario estándar de Cloud pri- 
vada con solo CPU como procesador, este constituirá nuestra infraes- 
tructura de control y se usa como referencia para la comparación. 

El otro escenario consiste en incluir una FPGA como un elemento 
de procesamiento de aceleración en uno de los nodos (ver Figura 13). 

En ambos escenarios, los clientes enviarán solicitudes para un 
servicio particular. Para este casi se ha seleccionado la Transformada 
Discreta de Fourier. 

Para evaluar el desempeño se ha considerado la tasa de cum- 
plimiento del acuerdo de nivel de servicio (SLA). Así, se contabiliza 
el número de cumplimientos de SLA. Por el contrario, una violación 
de SLA ocurre cuando el sistema no puede completar el servicio de 
software dentro de los requisitos de tiempo establecidos en la soli- 
citud del usuario. Por lo tanto, SLA cumplidos son aquellos que se 
completan sin sufrir una violación. 

La siguiente subsección entra en más detalles sobre banco de 
pruebas y la carga de trabajo. 
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Figura 13. Entorno de pruebas 


A. Carga de trabajo 


La infraestructura del banco de pruebas se divide en dos acto- 
res: el proveedor de servicios de Cloud y los clientes. Respecto al 
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proveedor, el módulo HAM ha sido desarrollado sobre el adminis- 
trador de infraestructura virtual (VMM), OpenNebula [7]. Además, 
se ha configurado KVM [23] como hypervisor. 

El hardware utilizado consiste en dos diferentes servidores. 
Uno de ellos es un Intel Core i5 con 6 Gb de la memoria RAM, con 
un Xilinx FPGA Virtex 6 entrelazado a su bus PCle. La FPGA Virtex 
6 es un ML605 Evaluation Kit, basado en Xilinx XC6VLX-240T- 
1FFG1156 [24]. 

El otro servidor consiste en un Intel Quad Core con 6Gb de 
RAM memoria sin FPGA. El servicio ofrecido es una emulación de 
lo La Transformada Discreta de Fourier. La transformada Discreta de 
Fourier (DF'T) es una herramienta importante en muchas ramas de 
la ciencia y la ingeniería [25], como en el procesamiento de señales 
digitales o procesamiento de imágenes. El DFT es también usado 
para resolver eficientemente ecuaciones diferenciales parciales, y 
para realizar otras operaciones como convoluciones [26]. Para la 
evaluación de la propuesta se usa el algoritmo de Cooley-Tukey 
[27]. Se ha elegido este algoritmo para reducir la complejidad 
computacional de O (N2) a O (Nlog2N) [28], y la regularidad del 
algoritmo lo hace adecuado para la implementación en hardware. 
Los detalles sobre el algoritmo completo se detallan en [28]. 

Para emular la parte de clientes solicitando el servicio con diferen- 
tes necesidades informáticas, el algoritmo se ejecuta un cierto número 
de veces sobre el la misma cantidad de datos. Entonces, el parámetro 
asociado con cada servicio solicitado indica la complejidad del trabajo. 

En la emulación, los clientes envían solicitudes de servicio 
DFT al proveedor. En esta solicitud se definen dos parámetros. El 
primero se refiere al tiempo de uso, y contiene el tiempo de inicio 
y finalización de la tarea. Por ejemplo, tstart = 12: 00: 00 y tend 
= 12: 35: 00. Esto significa que el servicio debe ser provisto dentro 
de este periodo de tiempo. Sin embargo, estos parámetros de entra- 
da son no obligatorios. Si no se proporciona tstart, el servicio será 
considerado como una solicitud inmediata y el tiempo del sistema 
se asignará a tstart (es decir, tstart = tiempo). Si no se proporciona 
tend, el servicio será considerado como uno de mejor esfuerzo, sin 
ninguna restricción de tiempo de finalización. En este caso, cual- 
quier recurso libre se puede asignar para la ejecución del servicio. 
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Figura 14. Definición de una tarea de usuario 


En el segundo parámetro se define el nombre del servicio 
como tal y la complejidad computacional del servicio definida como 
el número de DFTs para calcular sobre un cierto conjunto de datos. 

Se utiliza una distribución de Poisson como tasa de llegada de 
solicitudes, con una tasa A = 1/1, es decir, se genera una solicitud de 
servicio cada minuto. Los parámetros de cada solicitud de servicio se 
generan de forma aleatoria. En particular, cada cliente generará una 
solicitud de servicio con N aleatoriamente entre 30000 y 300000. La 
hora de inicio (tstart) se ha establecido en la hora actual cuando se 
genera cada solicitud. Se debe tener en cuenta que la hora de inicio se 
puede configurar en cualquier momento después del tiempo de envío. 

Para la hora de finalización, se han considerado dos tipos 
de solicitudes de servicio. Por un lado, los “clientes normales” que 
envían solicitudes cuyo tiempo de finalización (tend) se calculará 
como una distribución normal con q = 9 minutos y o = 0.5 * q. 
Por otro lado, los “clientes en tiempo real” exhiben tiempos de uso 
mucho más exigentes. Su tiempo de finalización se establecerá 
según una distribución normal con q = 0.9 minutos y o = 0.5 * q. 
Recuerde que el sistema rechazará aquellas solicitudes de servicio 
que no se pueden atender dentro del marco de tiempo especifi- 
cado con los recursos disponibles. Por lo tanto, se espera que los 
“clientes en tiempo real” necesiten hardware de aceleración para 
ser atendido adecuadamente. 

En la siguiente sección, se analiza el impacto de agregar ele- 
mentos de FPGA como hardware de aceleración y su administración 
con las técnicas propuestas. 
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B. Resultados 


La arquitectura y los algoritmos descritos en las secciones 
anteriores se han probado generando una carga de trabajo compues- 
ta por 60 clientes. La misma carga de trabajo tiene sido aplicado a 
los dos escenarios, servidores solo con CPUs y servidores con FPGA. 
Además, cada experimento ha sido repetido tres veces, y los resulta- 
dos que se muestran aquí son los valores promediados. 


TO 











Mumbor of Requests 








CPUs CPU and PPGA 


Figura 15. Total de peticiones que cumplen SLA 
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Figura 16. Distribución de peticiones 
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En cada experimento, tanto “clientes normales” como Los 
“clientes en tiempo real” se envían solicitudes de servicio al sistema. 
Como los nodos tienen ocho núcleos y una FPGA la razón de soli- 
citudes de tiempo real es de 1/7; es decir que por cada siete solici- 
tudes normales se genera 1 de tiempo real. Las solicitudes han sido 
mezcladas al azar siguiendo esta proporción. 
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Como se muestra en la Figura 18, el número de solicitudes 


aceptadas para el escenario en el que se utilizan solo CPUs es 51, y el 
número de solicitudes sin violación de SLA es 29. Por lo tanto, resulta 
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que el 57% de las solicitudes han sido atendidas con éxito. En el caso 
del escenario de CPU y FPGA, el número de solicitudes aceptadas es 
de 40, mientras que el 100% de las solicitudes cumplen el SLA. A 
pesar del hecho de que el número de solicitudes aceptadas es ligera- 
mente menor que en el escenario en el cual únicamente se usa CPU, 
el porcentaje de solicitudes que se sirven con éxito es del 100%. 

Finalmente, la proporción de solicitudes atendidas por cada 
clase de recursos se muestra en la Figura 16. Se puede ver que se 
ha asignado el 67% de las solicitudes aceptadas al FPGA. En resu- 
men, la fiabilidad de la arquitectura y las técnicas propuestas al 
proporcionar garantías de QoS se refleja en los resultados. Estos son 
resultados prometedores, especialmente porque solo hay un FPGA 
disponible como acelerador. 

Para el segundo escenario los resultados son similares como 
se puede observar en la Figura 17, en el caso que se usa la combi- 
nación de CPU y FPGA todas las solicitudes aceptadas por el sistema 
son cumplidas. Finalmente, en la Figura 19 se puede observar que la 
introducción de solicitud de mayor demanda hace que el sistema dis- 
tribuya de mejor manera las peticiones a los recursos para este caso se 
concentran más peticiones para los recursos que tienen CPU y FPGA 
(67%). Así, el sistema puede lograr distribuir de manera más eficiente 
la carga, aprovechando mejor las características de los recursos. 
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Figura 19. Distribución de peticiones 
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6. Conclusiones 


Una infraestructura heterogénea Cloud en el que los acelera- 
dores tales como FPGA y GPU se utilicen para reducir el consumo 
de energía puede ser una excelente forma de utilizar los recursos de 
una manera más eficiente. Por lo tanto, en este trabajo nos hemos 
enfocado en una arquitectura que soporte agregar un elemento de 
computación de hardware como acelerador y que pueda ser ofrecida 
al usuario como servicio. El trabajo futuro consiste en la implemen- 
tación de la arquitectura propuesta. Además en un futuro se pro- 
pone enfocar todos los esfuerzos en el diseño de una herramienta 
para planificación del uso efectivo de los recursos en el tiempo. Adi- 
cionalmente, exploraremos la factibilidad de usar la tecnología que 
ofrece Intel (SR-IOV) [15], para que múltiples máquinas virtuales 
puedan compartir el hardware de aceleración al mismo tiempo, jun- 
to con las funcionalidades que ofrece la reconfiguración dinámica y 
reconfiguración parcial de FPGAs [5]. 
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Resumen 


El problema relacionado con la búsqueda de topologías óptimas para despliegue de 
PON en una ciudad, para servir a un determinado número de usuarios, es en esencia 
un problema del tipo Optimización del Árbol de Steiner, el cual es un bien conocido 
problema del tipo NP-Hard. Así, para proponer soluciones para este tipo de problemas 
se deben emplear procesos de tipo heurístico. Por otro lado, se tiene el problema de 
seleccionar la tecnología PON más apropiada para satisfacer las demandas de ancho de 
banda de los usuarios, con escalabilidad e inversión redituable. En el presente artículo 
se detalla los aspectos técnicos y resultados obtenidos a través de un algoritmo para el 
despliegue óptimo de redes PON en grandes regiones urbanas caracterizadas por un 
gran número de usuarios potenciales de tipo residencial y corporativo que demandan 
diversos anchos de banda. El estudio presentado incluye una comparación del costo de 
implementación de distintos tipos y estándares de redes PON. 
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PON, estudio tecno-económico, optimización, algoritmo, heurísticas. 
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Abstract 


The problem related with the optimal search of topologies for the deployment of PON in an 
urban region, for servicing a given number of users, is essentially a Steiner-tree problem, 
which is a well-known NP-Hard problem. Therefore, in order to find solutions for this type 
of problems it is necessary the use of heuristic methods. On the other hand, there is the 
problem related with the selection of the most suitable PON technology, in order to satisfy 
the users? bandwidth demands in a scalable and profitable way. This paper details the 
technical aspects and the results obtained through the use of an algorithm which finds the 
optimal PON deployment in large urban regions with very large number of users with het- 
erogeneous bitrate demands. The study covers the costs comparison among different types 
of PON standards. 


Keywords 


PON, techno-economics, optimization, algorithm, heuristics. 


1. Introducción 


Debido a los múltiples problemas confrontados en el desarro- 
llo de redes ópticas de acceso de nueva generación (NG), el desarro- 
llo de soluciones que viabilicen el despliegue comercialmente viable 
de este tipo de redes, a constituido un tópico de investigación muy 
popular en los últimos años, especialmente el estudio de las redes 
Ópticas pasivas (PON) de nueva generación [1]. 

Particularmente, el estudio tecno-económico de las redes PON 
de nueva generación, mismas que incluyen en la tecnología de la 
red técnicas de transmisión y compartición del canal más comple- 
jas y avanzadas que las empleadas por los estándares actualmente 
existentes, como la multiplexación por división de longitud de onda 
(WDM) incluyendo la división de longitud de onda ultra-densa 
(UDWDM), ha recibido especial atención por parte de varios investi- 
gadores [2][3][4][5]. Las estrategias para la optimización este tipo 
de redes se basan en el estudio del despliegue de la red de distri- 
bución óptica (ODN) con el menor costo posible [6] [7][8], o en el 
diseño del hardware de la red [9][10]. 

En el año 2015 ya se publicó el estándar UIT para las redes 
Ópticas pasivas de nueva generación, el Next-Generation Passive 
Optical Network - Version 2 (NGPON2) [11]. 
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Se han propuesto varias alternativas para la topología de una 
red óptica de acceso, sin embargo la topología tipo árbol de PON es 
la única actualmente existente y comercialmente implementada en 
el mundo y que ha sido estandarizada para este tipo de redes [12]. 
La topología tipo árbol se basa exclusivamente en el empleo de divi- 
sores de potencia ópticos (splitters) en cascada con varias etapas, 
aunque en la práctica las PON se implementan hasta con dos niveles 
de splitting. En la Figura 1 se ilustra la topología lógica de una PON, 
donde puede observarse que la red parte de un transceptor óptico 
denominado “terminal de línea óptica” (OLT), ubicado en la “oficina 
central” (CO) del proveedor de servicios. A partir de ahí, a través 
de una fibra óptica (OF) denominada “fibra de alimentación” (Fee- 
der) se arriba a un splitter remoto generalmente ubicado a varios 
kilómetros de distancia, dentro de un gabinete que generalmente se 
encuentra en una esquina sobre la vereda o en algún lugar de acceso 
público, al que se le denomina “gabinete de calle primario” (PSC). 
Desde ahí, a través de cables ópticos de distribución de menor lon- 
gitud se llega o directamente al usuario final o a un segundo splitter 
para luego con cables ópticos de corta distancia (si el segundo spli- 
tter está en la entrada de un edificio, estos últimos cables general- 
mente con cables para interiores). En el extremo del usuario final 
se encuentra un equipo de transmisión-recepción denominado la 
“unidad óptica de red” (ONU). La red óptica que parte desde la OLT 
y llega a la ONU constituye la ODN. 

Sin embargo, en la práctica, para cubrir a un gran número 
de usuarios se realiza un despliegue simultáneo de múltiples redes 
PON, desde varias CO con muchas OLT (colocadas en racks de OLD, 
compartiendo de manera parcial las rutas y cables que se despliegan 
y en consecuencia la infraestructura de la instalación (i.e. ductos, 
zanjas, cables subterráneos y aéreos, gabinetes de calle, etc.). En la 
Figura 2 se puede observar la topología física típica de una imple- 
mentación real de múltiples PON en una región urbana. 
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Figura 1. Topología lógica y nomenclatura de una PON 
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Figura 2. Topología física típica de un despliegue de múltiples PON en 
una región urbana con muchos usuarios 
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Dada la complejidad que implica la instalación de este tipo de 
topologías, el estudio de la planificación para el depliegue óptimo de 
PON es de mucho interés para los operadores [13]. 

El resto del presente artículo está organizado como sigue: La 
sección 2 describe los parámetros generales, tanto de los escenarios 
urbanos a ser considerados, como los costos referenciales y pará- 
metros técnicos de los distintos tipos de PON que se cubren en este 
estudio. En la sección 3 se presentan los detalles de la formulación 
del problema de optimización que modela la búsqueda del desplie- 
gue de menor costo para múltiples PON en un escenario urbano 
extenso. La sección 4 explica los detalles del algoritmo matemático 
desarrollado para la solución del problema. En la sección 5 se mues- 
tran los resultados más relevantes de la investigación y, finalmente 
la sección 6 concluye el artículo. 


2. Parámetros y variables del problema 


A. Consideraciones generales 


El presente estudio se enfoca en el despliegue de redes PON 
para proveer fibra óptica al hogar (FTTH) a través de un óptimo 
dimensionamiento y planeación de la ODN. 

Para tal fin se consideran tres tipos de PON estandarizadas: 
(1) la GPON, (ii) la XGPON, [19] mismas que pueden conectar hasta 
64 usuarios empleando TDM/TDMA como técnicas de compartición 
del canal para bajada “downstream - DS” y subida “upstream - US”, 
respectivamente, y (111) el nuevo estándar NGPON2 [11], introduci- 
do por primera vez en el 2013 y cuya última revisión se publicó en 
el 2015, misma que es una red híbrida TDM/WDM con entre cuatro 
a ocho canales WDM densos (DWDM) tanto para DS como para US. 
NGPON2 no reemplaza los splitters por multiplexores, sino los man- 
tiene con el fin de proveer compatibilidad con la ODN de estándares 
anteriores de redes PON. 

Algunos trabajos de información relevantes proponen solucio- 
nes de hardware de bajo costo para NGPON2, como el reportado en 
[20]. También usamos en nuestro análisis una propuesta de red de 
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nueva generación a largo plazo denominada UDWDM-PON (PON 
con multiplexación ultra-densa de longitudes de onda) [21]. 

El escenario que se emplea para el desarrollo del presente 
estudio es el de una región urbana (1.e. una zona dentro de una ciu- 
dad o urbe) en la cual existe una gran densidad de habitantes y de 
entre ellos un gran número de usuarios (en el orden de cientos de 
miles) demandan servicios de acceso a Internet, con distintos anchos 
de banda, a través de conexiones FT'T'H. Tal número de usuarios no 
podrían ser cubiertos por una sola CO, de modo que se considera 
la presencia de varias CO en la región, cada una de ellas cubriendo 
una subregión de hasta aproximadamente 20000 usuarios a través 
de varios cientos de OLT en sus racks (i.e. cada OLT significa una 
PON individual a ser desplegada en la ciudad). Se asume que las 
CO están interconectadas entre sí, por ejemplo, a través de un anillo 
óptico metropolitano, como el que se observa en la Figura 2. 


B. Costos referenciales 


A través de interacción directa con proveedores de servicios 
y vendedores de equipos, hemos obtenido la información de costos 
referenciales que se detallan a continuación, en las Tablas 1, 2 y 3. 


Tabla 1. Costos de cables ópticos y trabajos de instalación 


Feeder Cable, 6 fibras /km 1000 
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Distribution Cable /km 2000 


Tabla 2. Costo de gabinetes 


Tabla 3. Costos del hardware PON 


OLT chasis - GPON (103 usuarios) 16000 
OLT chasis - XGPON (103 usuarios) 28000 








OLT chasis - NGPON2 (103 usuarios) 50000 
OLT chasis - UDWDM PON (103 usuarios) 85000 
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C. Parámetros de la red 





En la Tabla 4 se especifican los parámetros generales de cada 
tecnología PON que se considera en este estudio. El enfoque de la 
investigación es en la demanda de ancho de banda de bajada, DS, 
por parte de los usuarios, dado que el tráfico DS por parte de los 
usuarios es mucho mayor que el US. En el caso de UDWDM PON, se 
emplean los parámetros de la propuesta de Rohde reportada en [22], 
con la única variación de que en lugar de los 1024 usuarios a 1 Gb/s 
que se pueden conectar con la propuesta de Rohde, en este trabajo se 
considera un número más conservativo: 256 usuarios por cada OLT. 

Además, se consideran los siguientes: 


e Tipo de OF: UIT G652 D (monomodo estándar) 
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+  Atenuación en los splitters: a =3,5*log,(k) dB [99] (donde k 
es el número de ramales de salida del splitter). 
e Bitrate referencial (para normalización): BR_..= 10 Gb/s. 


En lo que respecta a las demandas de ancho de banda, o 
bitrate (BR), consideramos dos tipos de usuarios: residenciales y 
corporativos (donde el número de corporativos representan apenas 
el 2%, con es lo usual). Las demandas se consideran del tipo “ancho 
de banda mínimo garantizado” y para simular un escenario realista, 
estas son seleccionadas aleatoriamente dentro de los seis posibles 
rangos especificados en la Tabla 5. 


Tabla 4. Parámetros de las tecnologías PON consideradas 


Tecnología PON 


Componente 
P GPON XGPON NGPON2 UDWDM PON 
Max. longitud de enlace [km] 


DS bitrate por OLT [Gb/s] 256 


Tabla 5. Escenarios de demanda de bitrate 





, Bitrate (Mb/s) por tipo de usuario 
Escenario - 7 7 
10 - 50 100 - 500 
50 —- 100 500 - 1000 


5000 - 40000 





3. Formulación del problema 


A. Definición de conjuntos y variables 


Una región urbana donde se requiere el despliegue de una 
serie de redes PON, con el fin proveer acceso a la red a un determi- 
nado número de usuarios aleatoriamente localizados dentro de esa 
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región, puede ser tratado como un “grafo de conexión con pesos” 
(i.e. con conexiones dimensionadas de acuerdo a algún parámetro 
que permite determinar su “costo” o “peso”). En dicho grafo, las 
calles de la ciudad y sus intersecciones constituyen los bordes y los 
nodos del grafo, mismos que pueden ser utilizados como rutas de 
conexión desde las OLT, hasta las ONU, pasando por sus correspon- 
dientes PSC y SSC. 


Para describir matemáticamente el problema de optimización 


que modela la búsqueda del despliegue de redes PON en una ciudad 
al menor costo posible, es necesario primero definir las siguientes 
constantes, variables y conjuntos: 


CO: El conjunto de oficinas centrales, CO=4¿CO,), con 
cEf1,2,...,C); donde C es el número de CO disponibles. 

N,: El número de usuarios atendidos por la oficina central c, de 
manera que EN, =N, donde N es el número total de usuarios 
en la región. 

O: El conjunto de OLT, O=(0,3, con 0€(1,2,....My, donde M 
es el número de OLT disponibles. 

U: El conjunto de ONU, U=£fONU y, con n€(1,2,....N+, donde 
N es el número de ONU requeridas. 

W: El conjunto de longitudes de onda, W=X¿Aw $, con w€(1, 
2,...,.L); donde L es el número de longitudes de onda disponi- 
bles en el transmisor de una OLT. Específicamente: L=1 para 
GPON y XGPON, L=4 para NGPON2 y L=256 para UDWDM 
PON. 

L.: El conjunto de splitters disponibles en un gabinete locali- 
zado en el sitio ¡. También se define en este contexto al pará- 
metro S,, como el [**” splitter, en el gabinete 1, cuyo rango de 
división (“splitting ratio” — SR) se denota como K, y es igual a 
2", donde r es número entero positivo. 

B: Es el conjunto de sitios candidatos para colocar un SSC. 

V: Es el conjunto de sitios candidatos para colocar un PSC. 

n ..: Es el máximo número de usuarios por OLT. 

ODN, : La máxima atenuación, en dB, permitida en la ODN. 


loss* 
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Parámetros relacionados con la capacidad de la red PON se 
definen como sigue: 


e  BR..,: Bitrate de referencia (para normalización). 
e  BR,g,: La bitrate total para US por OLT y por cada A. 


e  BR,,,: La bitrate total para DS por OLT y por cada A. 

e  BR;,: La bitrate total demandada por la ONU n€Uc en direc- 
ción US. 

e  BR;.: La bitrate total demandada por la ONU n€Uc en direc- 
ción DS. 

e  T,,: La capacidad total normalizada de bitrate en dirección US 
para una OLT, tal que T,, = (L*BR,,,) / BR.., 

e  T,,: La capacidad total normalizada de bitrate en dirección DS 
para una OLT, tal que T,, = (L:BR,. o, / BR..; 

e yr: La demanda de bitrate normalizada de la ONU n€Uc, en 
dirección DS, tal que y. = BRE, / BR, 

e Y, La demanda de bitrate normalizada de la ONU n€Uc, en 
dirección DS, tal que y;, = BR;. / BR.., 


Además, se empleará un conjunto de parámetros relacionados 
con los sitios, rutas físicas y costos. Para el efecto se supondrá que en 
la región bajo estudio ST es un conjunto de calles apropiadas para 
enrutar cables ópticos y BL es el conjunto de edificios (i.e. cualquier 
lugar donde haya uno o más usuarios demandando conectividad): 


e  I[: El conjunto de nodos en calles y en edificios (intersecciones 
y vértices), 1 =(1EXSTBL) / i=1,2,...,T y; donde T es el número 
total de nodos. 

e E: El conjunto de bordes (enlaces entre nodos) E=1e, E / 
(Mm 

e as: es una constante binaria que indica (si su valor se 1) que la 
OLT 0€O está ubicada en la oficina central ceCo. 

. de. La distancia total entre dos nodos (i,j)€l no necesariamente 
adyacentes. 

e  Cf,: Es el costo por unidad de longitud de un cable óptico de 
alimentación (Feeder OF). 

e  C),: Es el costo por unidad de longitud de un cable óptico de 
distribución (Distribution OF). 
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e  C,: El costo por unidad de longitud del zanjado 
e  C' ,: El costo de un gabinete óptico en el sitio 1 
e  C,,El costo del [*"” splitter en el gabinete i. 


. Crec: El costo de un rack de OLTs con capacidad total de hasta 
r usuarios. 

e Cir: El costo de un tranceiver OLTS. 

e  C,,El costo del 1$'”" splitter en el gabinete 1. 

. Co y: El costo de un gabinete de distribución óptico (ODF). 


. E El costo de una ONU. 


. E El costo de las labores de instalación y configuración del 
a PON en la oficina central c. 

. ,: La máxima por unidad de longitud en la OF 

. a, “Atenuación en el 167" splitter ubicado en el gabinete 1. 


. a. “La atenuación insertada en la ODN por otras fuentes. 


Adicionalmente, el modelo de optimización propuesto en este 
trabajo requiere la definición de las siguientes variables binarias: 


O, de otra manera 
1, sielSSC j está conectada al PSC i 
O, de otra manera 


lo si la ONU n está conectada al SSC j 


O 


0 si un splitter en el PSC i está conectado a la OLT o 
de otra manera 


“=b si el sitio candidato ¡efV U B) está activo 
de otra manera 


e 


si la OLT o está activa (conectada) 
o, de otra manera 


a 


_ sl si el Jésimo splitter en el sitio i está conectado 
O, de otra manera 


ji lo si la ONU n se conecta al el 1$570 splitter ¡ 
Mm lo, de otra manera 
1, si el I[$$iM0 splitter ubicado en el sitio j se 
Yi => ome con el pésiM0 splitter del sitio i 
O, de otra manera 
le pe e si la ONU n se conecta con la OLT o 
dá O, de otra manera 
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B. Formulación del problema de optimización 


La función objetivo del problema de optimización apunta a 
minimizar el costo total de implementación de las múltiples PON 
que deberán ser desplegadas a partir de varias CO en una gran zona 
urbana extensa con gran número de usuarios en ella. Una ventaja de 
optimizar toda la extensa zona en el mismo problema es que se pue- 
de variar la distribución de las subregiones servidas por cada CO con 
el fin de buscar la resolución óptima del problema. En la siguiente 
sección explicaré cómo se resolvió a través de un enfoque heurístico 
este problema combinatorio. En media se tendrá N / C usuarios en 
cada subregión servida por las CO (N es el número total de usuarios 
y C el número de CO en la región extensa a ser servida). 

La función objetivo es la que se muestra en la Ecuación (1). 


min y Ciby + Cr y» y» Alis F y y AX ¡0 ¡ 


ceCO 0€0 ¡ev 1eV jeB 
+Cf y Y asxodio + Y) Cóirta, 
0€0 ¡eV ¡e[VUB) 
+8) 2 9ui+),) Andy 
1eV jeB jeB neU 
+ y» y» SiC; + y) Conc; 
¡e[VUB) leL; ¡e(VUB) 
N rack,n 
J n (Corr + Copr) + ConuN (1) 


La ecuación (1) está compuesta por una suma global que cal- 
cula el costo de implementación para cada subregión servida por las 
CO. La suma de costos incluye, respectivamente: los costos de labor 
en la CO y de despliegue de la OF tanto para el zanjado como para 
el costo de los propios cables, el costo del hardware PON en la CO, 
el costo de los splitters y gabinetes de calle, y el costo de las ONU. 
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El conjunto de restricciones que aseguran que el modelo esté 
apegado a una implementación realista de la red son: 


e El número de usuarios conectados a la CO debe ser igual a: 
No = PD) 052%: VcECcO (2) 
neU 0€0 
e El número de usuarios por OLT debe ser menor o igual a: 
E < NmaxKCo; VcEcCcO (3) 
neU 


e La demanda de bitrate máxima por OLT no debe ser mayor que 
su capacidad US y DS: 


y ZnYus/os € Tus/ps%o; WOE0 (4) 
neU 


e Una ONU debe estar conectada a un solo splitter que esté ubi- 
cado en un determinado sitio j: 


Li vneu (5) 


neU 


e Un SSC debe estar conectado a un y solo un PSC: 
Y = 0 VjEB (6) 
LeV 

e Un splitter en un PSC debe llegar a una y solo una OLT: 


Y Xu0Ss = (Ui, ViEV (7) 


0€0 
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e El número de splitters activos en un sitio 1 debe ser menor o 
igual a la capacidad del gabinete: 


y Sil < QT; Vi€ tv U B) (8) 


neU 


e Una ONU se puede conectar a un splitter en el sitio i si existe 
una conexión física desde la ONU al sitio i. 


yA Sai WiE(VUB)VnEU,VlEL, (9) 


e Un splitter l en un SSC ubicado en el sitio j se puede conectar 
con otro splitter p en un PSC ubicado en el sitio i, si existe una 
conexión física desde i aj. 


y < xj WieV VpEL,jEB,VlEL¡ (10) 


e El número de ONU que se conectan al lesimo splitter activo de 
un SSC en el sitio j no puede exceder la capacidad del splitter. 


neU 


e El número de ONU más splitters secundarios que se conectan a 
un splitter primario, no puede exceder la capacidad del splitter 


Y y +) y < KipSip; WiEV,VpEL; (12) 
neU JjeB leL; 


e La atenuación desde una ONU a su respectiva OLT debe ser 
menor o igual a la máxima atenuación permitida en la ODN: 


ArO y Xn ¡An ¡ + k y y Xn ¡X¡oX¡ ¡01 + E yA XLo do 


jeB leV jeB 0€0 leV 0€0 
Ilo j,l ip 
jEB leL; 1EV peL; jeB leL; 


eS Lex E ODNoss (13) 
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4. Algoritmo de Solución Desarrollado 


A. Función primaria de OTS 


El problema descrito por la Ecuación (1), se trata de un proble- 
ma de optimización del tipo Árbol Mínimo de Steiner, el cual es un 
bien conocido problema del tipo NP-hard, lo que significa que a medi- 
da que no tiene solución exacta o no se puede calcular en un tiempo 
finito [23]. De modo que para encontrar una solución he desarrollado 
un algoritmo que hace uso de una serie de heurísticas. El algoritmo 
trabaja con una función principal (PF) y una serie de funciones secun- 
darias (SF) que son ejecutadas programadamente para que realicen 
una determinada tarea. A este algoritmo lo he denominado Optimal 
Topology Search (OTS) [18], mismo que trabaja usando datos de 
mapas reales provistos por la plataforma de uso abierto OpenStreet- 
Maps” (OSM). Esto le da la capacidad a OTS de resolver problemas 
de prácticamente cualquier lugar en el mundo. 

La PF carga los datos de OSM (¡.e. las coordenadas de estruc- 
turas pertenecientes a calles y edificios, incluyendo sus atributos). 
Dicha información es utilizada tanto para graficar el mapa de la 
zona donde se realiza el despliegue de la fibra, como para los cálcu- 
los que realiza el algoritmo. 

En el mapa descargado, cuando se usa el modo simulación 
(i.e. sin usar datos reales de clientes, su ubicación y demanda de 
bitrate), PF genera aleatoriamente usuarios en los edificios (depen- 
diendo de su tamaño y tipo de edificio: residencial o corporativo) y 
les asigna aleatoriamente una demanda de ancho de banda, depen- 
diendo del escenario que se quiere simular (ver Tabla 5). La Figura 
3 ilustra una porción de mapa con usuarios. 

La generación aleatoria de usuarios se hace en base al área 
de los edificios (que se puede calcular en base a las coordenadas de 
su perfil) y al número de pisos de este (información proporcionada 
directamente por OSM). 

OTS tiene la capacidad de resolver el problema para un gran 
número de usuarios (en el orden de los cientos de miles) todos ellos 
con heterogéneas demandas de ancho de banda. 
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Latitude (9) 





7.6625 7.663 7.6635 7.664 7.6645 7.665 7.6655 7.666 7.6665 7.667 7.6675 
Longitude (?) 
Figura 3. Mapa de ciudad con usuarios en edificios residenciales y 
corporativos (uno de este tipo se ve en la esquina superior izquierda) 


generados por OTS 


A continuación PF agrupa los usuarios en grandes clúster 
alrededor de las CO a través de una teselación del tipo Voronoi de 
la región [24]. Cada clúster significa una subregión servida por su 
respectiva CO. Inicialmente el centro de cada clúster corresponde 
al centro de masa de los usuarios, el cual no corresponde (a menos 
que coincidencialmente coincida) a la ubicación del edificio de la 
CO. A través de las SF (que son escritas en detalle a continuación) 
se evalúa el costo del despliegue de múltiples PON usando esa clu- 
terización inicial, y se guarda ese costo. Luego, se realiza una varia- 
ción de los centros de los clúster (lo que significa un cambio de su 
tamaño y forma) en dirección a la ubicación geográfica de la CO, y 
se vuelve a calcular el costo. Este nuevo costo es comparado con el 
costo anterior, y si resulta mejor, se lo registra como el “menor cos- 
to” hasta ahora encontrado y se salva su topología, de otra manera 
se descarta. Así sucesivamente el algoritmo busca con iteraciones y 
finura programables el menor costo. El algoritmo converge luego 
de un determinado número de iteraciones que no se ha encontrado 
un costo menor (por defecto cinco, pero se puede cambiar ese valor 
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para dar más confiabilidad, aunque eso aumenta la exigencia del 
cómputo). Dicho procedimiento constituye una heurística del tipo 
Tabu Search [25]. 

En la Figura 4 se ilustra un mapa con tres CO y sus respectivas 
subregiones iniciales (definidas por las líneas inter-punteadas de 
color negro) y posteriormente los mapas con clúster modificados, 
luego de varias iteraciones del algoritmo, donde los centros de masa 
de los clúster se han movido acercándose a la ubicación de los edi- 
ficios de las CO. 


B. Funciones secundarias de OTS 


El conjunto de SE llamadas por PE son las siguientes: 


e  dllocate ssc: Identifica los edificios que tienen usuarios (resi- 
denciales o corporativos) y les asigna un SSC una acometida 
desde la calle más cercana al edificio (de entre todas las que 
circundan los mismos). En la Figura 5 se observa una región 
con varios edificios a los cuales la función allocate ssc les ha 
asignado un SSC (triángulos rojos) incluyendo su acometida 
(líneas de color rojo) perpendicular hasta la calle más cerca- 
na (las calles son resaltadas por las líneas de color azul en la 
gráfica). 

e  clustr_ build: Divide una subregión de usuarios en clusters, pero 
no lo hace agrupando usuarios directamente sino a edificios. 
Se utiliza un enfoque del tipo Shared Nearest Neighbor (SNN) 
[26], en el cual los edificios son considerados como entida- 
des individuales con atributos numéricos y categóricos. Esta 
función secundaria de OTS utiliza tres atributos específica- 
mente: el tipo de usuarios en este, el número de usuarios, y el 
ancho de banda agregado que demandan los usuarios dentro 
del edificio. Así los usuarios dentro de los edificios terminan 
agrupados según los parámetros antes mencionados, lo cual es 
muy útil para dimensionar adecuadamente el hardware PON 
necesario para atender sus requerimientos de ancho de banda. 
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Figura 4. Ilustración del cambio de los las regiones servidas por las CO, 
en la medida que OTS mueve su centro de masa en cada iteración. (a) 
Centros de los clúster lejos de los edificios de sus respectivas CO, (b) 

Centros de los clúster cerca de los edificios de las CO 
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En la agrupación se toma en cuenta la capacidad de la tec- 
nología PON que se esté planificando desplegar (máximo ancho de 
banda y número máximo de usuarios que se puede servir con una 
OLT de la tecnología PON que se emplee). En la Figura 6 se observa 
la asignación de usuarios y asignación de los mismos a una determi- 
nada PON (a una OLT) a través de la agrupación de edificios (cada 
color corresponde a una PON). Este enfoque es realista dado que 
en la práctica no es eficiente conectar a la mitad de usuarios de un 
edificio a una OLT y la otra mitad a otra OLT. 
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Figura 5. Ilustración de la asignación de SSC a edificios y acometida de 
OF a la calle más cercana 


e  ageregate: Dimensiona la cantidad y ubicación de los PSC en 
la ciudad a través de la clusterización de PON (las PON que 
fueron previamente dimensionadas y asignadas a usuarios por 
la función anterior). Para el efecto se utiliza una serie de sitios 
candidatos y nuevamente una teselación de Voronoi (esta vez 
dentro de la subregión servida por una sola CO). Los centros de 
masa de los clusters se emplean para la selección inicial del sitio 
para colocar el PSC, y a través de una búsqueda utilizando un 
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algoritmo del tipo Random Search, que modifica la cantidad de 
PSC en cada iteración, se dimensiona de forma óptima los PSC 
en una subregión. La Figura 7 muestra la agrupación de PON a 
través de una teselación de Voronoi (líneas inter-punteadas de 
color negro) y la ubicación óptima de los PSC. 
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Figura 6. Clusters de usuarios para asignación de hardware PON. Cada 
color corresponde a un grupo de ONU de usuarios asignados a la misma 


OLT (cada color corresponde a una PON individual) 


e OF feeder;¡OF distrb;Share: Estas tres funciones evalúan el 
zanjado, la compartición de ductos, y las rutas óptimas para el 
despliegue de los cables ópticos desde las CO hasta los usua- 
rios finales. Para el efecto se utiliza una versión modificada del 
algoritmo de Dijkstra, el cual busca la iterativamente las rutas 
más cortas utilizando el criterio no solo de la distancia sino 
de la recursividad de una ruta (debido a que se debe también 
optimizar el zanjado y la compartición de ductos). El algo- 
ritmo modificado de Dijkstra modifica la matriz de costos en 
cada iteración disminuyendo el costo de las rutas más recursi- 
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vas (haciéndolas más favorables en cada iteración). La Figura 
8 muestra el trabajo de estas funciones. 

e  Evaluate cost: Esta función evalúa el costo del despliegue de 
las PON en la región bajo estudio, incluyendo todas las com- 
ponentes especificadas en la Eq. (1), utilizando para el efecto 
costos actualizados y realistas obtenidos directamente de ope- 
radores y vendedores. El costo calculado por esta función es 
enviado a la PF para que lo utilice como criterio de decisión 
para decidir si la topología actual es menor (o no) que la que 
actualmente está registrada como la topología de menor costo. 


5. Resultados 


A. Función primaria de OTS 

OTS encuentra una solución óptima de menor costo para el 
despliegue de múltiples PON en zonas urbanas extensas con muchos 
usuarios y con variadas demandas de ancho de banda. Dado que 
se trata de una solución basada en heurísticas no es seguro que se 
trata de la solución óptima absoluta, pero sí provee de una solución 
óptima cuya confiabilidad depende del número de iteraciones, de 
la precisció de la búsqueda y del tipo de barrido que se programe 
(muchos pasos de corta distancia, pero sin embargo ello implica más 
tiempo computacional consumido en la búsqueda de la solución). 

OTS devuelve dos tipos de resultados: numéricos y gráficos. 
Los resultados numéricos incluyen tablas detalladas de la distribu- 
ción de PON entre edificios y usuarios, como: a qué SSC y PSC están 
conectadas, la ubicación y dimensión de los SSC y PSC y la longitud 
y tipo de cables ópticos. Se presenta además información detallada 
de los costos, tanto de las componentes de cada subregión, así como 
de toda la zona evaluada. 

Con el fin de presentar los resultados de un específico esce- 
nario de solución se ha escogido una región del centro de varias 
ciudades, escogiendo zonas que tengan potencialmente alrededor 
de 100000 usuarios. 
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Figura 8. Función OF _feeder: (a) Rutas desde la CO hasta los PSC generadas 
por la primera iteración de la función (usando una versión modificada de 
Dijkstra) (b) Rutas óptimas determinadas una vez que el algoritmo converge 


En dichas zonas se corrió OTS para encontrar la solución de 
menor costo para el despliegue de todas las tecnologías PON espe- 
cificadas en la Tabla 4. 
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En la Figura 9 se muestra la solución encontrada por OTS en 
una porción de la ciudad de Turín (Italia). Se observa en las gráficas 
la posición de los PSC, los SSC, así como las rutas de los cables ópti- 
cos (de feeder y distribución). En la tabla VI se detalla los resultados 
de costos de implementación para las tecnologías PON consideradas 
y para cada uno de los seis bitrate especificados en la Tabla V. 


Algoritmo 1: Optimal Topology Search (OT'S) 
Data: Data = load data (City, Users, CO) 


Result: Optimal Topology=0TS(Data) 
begin 
for ¡€ [Heuristic_modifier_counter' do 
Data; =i% heuristic_variation (Data) 
for cECO do 
SSC = allocate_ssc (Data;) 
PONardware = Cluster buildings (SSC, Datai) 
PSC = ageregate (PON) 
OF cables = find_paths (SSC, PSC, Data;) 
ODN= (OF cables, PSC, SSCy 
Trenching = share (ODN) 
T opologyi= fODN, PON hardware y 
end 
C;= evaluate_cost (Topologyi) 
if C¡< Copt then 
Optimal _topology = Topology; 
Copt = Ci 
end 
end 
end 


Tabla VI: Costo del despliegue para 2-10” usuarios 


COSTO (millones de USD) 
Escenario 
GPON XGPON NGPON2 UDWDM PON 


INICIO EEE IE EEC 
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Figura 9. Resultado gráfico entregado por OTS: Una porción de una subregión 


de la ciudad de Turín, en la que se observa la ubicación óptima de los PSC, los 
SSC asignados a cada edificio, y los cables ópticos enrutados en las calles 


Nótese que una región con cerca de 100000 usuarios es 
realmente mucho más grande que la región del mapa de ejemplo 
mostrada en la Figura 9. En tal región, realmente se tienen varias 
subregiones servidas cada una de ellas por una CO diferente, con 
aproximadamente 20000 usuarios en cada subregión. En la Figura 
10 se muestra un ejemplo de una zona urbana con tres CO (los edifi- 
cios de cada subregión están pintados de un distinto color). Se trata 
solo de un ejemplo con fines ilustrativos ya que en la práctica las 
subregiones, con cerca de 20000 usuarios, son mucho más grandes. 

En la Figura 11 se puede apreciar una comparación de los cos- 
tos de implementación para las cuatro tecnologías PON considera- 
das en este estudio y para los seis escenarios de demanda de ancho 
de banda (bitrate) detallados en la Tabla V. Es interesante verificar 
que los resultados del escenario 1 (usuarios residenciales deman- 
dando entre 10 a 50 Mb/s de ancho de banda), que corresponde 
a un escenario de demanda real en el presente, da como resultado 
valores bien conocidos en la actualidad: GPON es la tecnología más 
redituable, ya que su costo de despliegue corresponde a aproxima- 
damente $500 por cada usuario (un costo absolutamente real hoy 
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en día para el despliegue de GPON), mientras que XGPON es más 
costosa (no se justifica la inversión aún) y mucho más costosas en 
este escenario son la NGPON2 y la UDWDM PON. 

En el escenario 2 (usuarios residenciales demandando entre 
50 a 100 Mb/s), escenario cercano al actual (real en algunas ciuda- 
des del primer mundo y casi real en la mayoría de las urbes), GPON 
se convierte en una solución un poco más costosa, sin embargo, 
las otras tres tecnologías siguen siendo más caras de implementar 
(nótese de todos modos que la brecha de costos se ha reducido pues 
no ha cambiado el precio de implementación de las otras tecnolo- 
eías, solo ha subido el costo de GPON). 

El escenario 3 (usuarios residenciales demandando entre 100 a 
400 Mb/s), que es un escenario a corto plazo (pocos años en el futu- 
ro), implementar la tecnología GPON deja de ser la mejor opción ya 
que se torna más costosa que la XGPON, NGPON2 es no mucho más 
costosa que GPON y XGPON, lo cual es muy interesante dada la consi- 
derablemente mayor escalabilidad de NGPON2 frente a las otras dos. 

Para el escenario 4 (usuarios residenciales demandando entre 
100 Mb/s a 1 Gb/s), el cual es por supuesto un escenario a largo plazo 
(sobre todo por la consideración de tener usuarios que demanden en 
sus casas velocidades cercanas o iguales a 1 Gb/s), NGPONZ2 es cla- 
ramente la mejor opción frente a las otras tecnologías. Se trata de un 
punto de inflexión que hace pensar en la conveniencia de implementar 
esta tecnología, ya estandarizada, incluso desde el escenario anterior. 
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Figura 10. Resultado gráfico entregado por OTS: Una zona de la ciudad 


de Medellín, Colombia, con tres subregiones 
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Despliegue óptimo de redes PON, usando mapas reales 


Los escenarios 5 y 6 son escenarios a muy largo plazo (el 6 más 
demandante que el 5 dado que pretende que los usuarios requieran 
al menos 1 G/s, mientras que el 5 supone una demanda desde los 
500 Mb/s). En el escenario 6 el aumento de costo de GPON es tan 
alto que incluso no es práctico incluir a esa tecnología en la gráfica 
para dicho escenario. Es poco predecible en cuántos años en el futu- 
ro los usuarios podrían demandar estos enormes anchos de banda, 
pero desde este análisis queda claro que solo entonces tendría senti- 
do pensar en implementar una tecnología tan costosa como lo sería 
la UDWDM PON (aunque es la que potencialmente puede entregar 
más ancho de banda a los usuarios en un futuro aparentemente 
lejano). 


350 


—A— CO hardware: GPON 

300 F| —4— CO hardware: XGPON 
—A— CO hardware: NGPON2 

250 —6— CO hardware: UDWDM PON 


200 


150 


Cost (millon of USD) 





Bit rate demand scenario 


Figura 12. Costo total para aproximadamente 1000 usuarios del hardware 
PON en la CO para GPON, XGPON, NGPON2 y UDWDM PON en los 


seis escenarios de demanda de bitrate 


La Figura 12 permite apreciar algo que en la figura anterior es 
también evidente: el aumento en el costo de implementación de una 
tecnología, con el aumento del ancho de banda, se debe principalmente 
al aumento en el costo del hardware PON, sobre todo en la CO. Esto 
se debe a que cuando una demanda de ancho de banda, por parte de 
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los usuarios, comienza a sobrepasar los límites de una tecnología, esta 
comienza a convertirse en una solución costosa y poco redituable. Es 
importante ver en la figura que las tecnologías que casi no cambian su 
costo de implementación (aunque inicialmente mayor) son NGPON2 y 
UDWDM PON (esta última casi no cambia de costo de hardware inclu- 
so en el escenario 6, lo que significa que es la solución más económica- 
mente escalable de todas). Las otras dos, GPON y XGPON, incrementan 
su costo exponencialmente en los seis escenarios considerados. 


6. Conclusiones 


El presente trabajo de investigación evidencia la utilidad, ver- 
satilidad y confiabilidad de OTS para el análisis tecno-económico 
del despliegue óptimo de redes PON en zonas urbanas extensas con 
heterogéneas y cambiantes demandas de ancho de banda por parte 
de los usuarios. 

OTS puede ser utilizado para el análisis del despliegue óptimo 
no solo de PON, sino de todo tipo de red de información, como enla- 
ces punto a punto o fronthauling para redes inalámbricas de nueva 
generación, lo que constituye potencialmente nuevos trabajos de 
investigación utilizando esta herramienta. 

Se pueden llegar a conclusiones muy relevantes gracias al 
empleo de OTS en un análisis tecno-económico, que soporten la 
toma de decisiones de inversión, tales como los escenarios en los 
cuales el despliegue de una determinada tecnología sería o no redi- 
tuable y el dimensionamiento de la escalabilidad de una solución 
tecnológica frente al cambio de las demandas de los usuarios. 
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Resumen 


Una correcta evaluación e interpretación mamográfica demanda un alto nivel de ex- 
perticia del radiólogo observador, depende directamente de un adecuado análisis vi- 
sual de los hallazgos y la correlación de las características radiológicas extraídas de 
diferentes proyecciones mamográficas. En este artículo se presenta un esquema de 
clasificación automática de nódulos contenidos en Regiones de Interés (Rols), extraí- 
dos de dos diferentes proyecciones mamográficas (Medio Lateral Oblicua y Creaneo- 
Caudal) obtenidas de la misma glándula mamaria, mediante un estrategia de fusión 
de información ipsilateral. Una vez que, el radiólogo especialista selecciona una Región 
de Interés en las dos proyecciones mamográficas, estas son caracterizadas mediante 
descomposiciones multi-resolución y multi-escala, para lo cual, cada Rol es proyectada 
sobre dos espacios diferentes definidos por los momentos de Zernike y la transfor- 
mada Curvelet, respectivamente. Así esta información heterogénea es optimamente fu- 
sionada mediante una estrategia de aprendizaje de múltiples kernels (Multiple Kernel 
Learning) construida por un entrenamiento con máquinas de soporte vectorial (SVM). 
El desempeño de la estrategia propuesta para clasificar nódulos malignos y benignos, 
fue evaluado respecto a un esquema de clasificación basado en el análisis de la Rol 
correspondiente a una única proyección, para lo cual se utilizaron un conjunto de 980 
Rol extraídos de 490 casos de estudio de la base de datos de mamografía (DDSM) y 
216 Rol extraídos de 108 casos de estudio de la base de datos INBreast. Los resulta- 
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dos obtenidos reportan una sensibilidad del 98.3% y especificidad del 94.5% frente a 
una sensibilidad del 96.2% y especificidad del 93.1% obtenidos cuando se utilizaron 
características multi-resolución en una única proyección. Estos resultados sugieren que 
la estrategia propuesta puede ser útil en escenarios clínicos y puede contribuir a la 
capacitación de nuevos radiólogos como segundo lector. 


Palabras clave 


Diagnóstico asistido por computador, multiple kernel learning, transformada curvelet, 
momentos de zernike. 


Abstract 


Correct mammography assessment and interpretation demands great expertise of radiolo- 
gist observer and depends directly on a suitable visual analysis of mammographic findings 
and their correlation with radiographic features extracted from different mammographic 
views. In this paper, an automatic classification scheme for mammographic nodules con- 
tained on Regions of Interest (ROls) is presented, which is based on an information fusion 
approach by using Rols extracted from two different mammographic views of the same 
breast, a Mediolateral Oblique (MLO) view and a craniocaudal (CC) view, respectively. 
Once the expert radiologist selects a Rol from the two mammographic projections, those 
are characterized by using a multiresolution and multiscale decomposition approaches. 
For doing so, each Rol is projected into two different spaces defined by Zernike moments 
and Curvelet transform, respectively. Finally, this extracted heterogeneous information is 
optimally fused by using a Multiple Kernel Learning strategy based on Support vector 
machine scheme. The performance of the herein proposed strategy, for classifying benign 
and malignant nodules, was evaluated respect to the classical mammographic analysis 
based on only mammographic view, for which a set of 980 ROISs extracted from 490 cases 
and other set of 216 Rol extracted from 108 cases, which were extracted from DDSM and 
INBreast databases, respectively. The obtained results reported a sensitivity of 98.3% and a 
specificity of 94.5% respect to 96.2% and 93.1% of sensibility and specificity, respectively, 
and obtained by the analysis based on an only mammographic view. These results sug- 
gest that the herein proposed strategy could be useful in real clinic scenarios and could be 
contributing to the training of new radiologists. 


Keywords 


Mammography, computer aided diagnosis, multiple kernel learning, curvelet transform, 
zernike moments. 
1. Introducción 


La mamografía es aún considerada la mejor técnica costo-efec- 
tiva para detectar anormalidades relacionadas a la presencia de cán- 


Fabián Narváez 


cer de mama en etapas tempranas de desarrollo [1, 2]. El tamizaje 
a través de mamografías ha demostrado ser efectivo reduciendo la 
mortalidad por el cáncer de mama con porcentajes que varían desde 
el 30 al 70% [3]. Sin embargo, la sensibilidad diagnóstica durante 
el tamizaje mamográfico es ampliamente afectada por: la calidad 
de las imágenes mamográficas, la similitud de los tejidos normales 
frente a los anormales visualizados en la mamografía y la experien- 
cia del radiólogo observador, lo que produce una alta variabilidad 
inter e intra-observador durante la interpretación de los hallazgos 
mamográficos. Estudios previos han reportado que la sensibilidad 
del tamizaje mamográfico varía entre el 85% y 90%, mientras que 
otros estudios han encontrado un importante porcentaje de presen- 
cia de falsos positivos durante los procesos diagnósticos, entre el 
10% y 30% [4, 5, 6]. 

Durante las últimas décadas han sido propuestas diferentes 
soluciones con el propósito de incrementar la exactitud durante 
la interpretación mamográfica, su sensibilidad y especificidad, así 
como, reducir las tasas de biopsias innecesarias causadas por ciertas 
imprecisiones diagnósticas, entre estas soluciones importantes, el 
Colegio Americano de Radiología (American College of Radiology, 
ACR) desarrolló un sistema para el reporte diagnóstico mediante 
una terminología estandarizada para los informes de hallazgos 
anormales en imágenes mamarias (BI-RADS) mediante una semio- 
logía radiológica, para de esta manera asignar una categoría entre 
O y 6, de acuerdo a sus características radiológicas específicas. Estas 
categorías apoyan a los médicos y determinan la probabilidad de 
malignidad para considerar ciertas recomendaciones finales para el 
manejo y control de los hallazgos [7]. 

En el caso particular de las masas mamarias, de acuerdo al 
BI-RADS se describen por su forma, margen y densidad. En la quinta 
edición de BI-RADS, la forma se describe como ovalada, redonda e 
irregular y el margen como circunscrito, oscurecido, microlobula- 
do, espiculado o indefinido. Finalmente, la densidad, a la cual se 
le considera como la atenuación de la masa con respecto al tejido 
elandular, se puede describir como Alta densidad, Igualdad de 
densidad, Baja densidad o Grasa. La figura 1 ilustra el espectro de 
características visuales que determinan el nivel de probabilidad de 
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malignidad de acuerdo a la formas de masa y márgenes descritos en 
el sistema BI-RADS. 


Benigno p Maligno 


Redondo Ovalado Irregular 


-000 0% 


Circunscrito  Oscurecido Microlobulado  Indistin Espiculado 





Figura 1. Diferentes tipo de formas y márgenes de masa definidos en el BI- 
RADS. El grado de malignidad depende de estas características morfológicas 


Como ilustración, una masa con forma redonda u ovalada, 
margen circunscrito y baja densidad tiene una alta probabilidad de 
ser benigna, mientras que una masa con forma irregular, margen 
espiculado y alta densidad es sospechosa de cáncer [8]. Este valor 
también define el manejo particular del paciente, es decir, los valo- 
res bajos implican que el paciente es mantenido con un adecuado 
control periódico mientras que los valores altos generalmente con- 
ducen a la posibilidad de biopsia y estudio patológico adicional. 
Sin embargo, la interpretación mamográfica sigue siendo una tarea 
subjetiva y difícil para el radiólogo. 

Por otro lado, se han desarrollado tecnologías de Diagnóstico 
Asistido por Computador (CAD) como herramientas computacio- 
nales para asistir al radiólogo durante la toma de decisiones y son 
usadas como segundos lectores. En la actualidad, estos sistemas 
CAD son considerados como un potencial soporte al diagnóstico y 
tamizaje mamográfico, los mismos que han demostrado su utilidad 
durante la identificación de agrupamientos de micro-calcificaciones 
[9, 10], reportando una sensibilidad que varía entre el 75 al 90%, 
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pero su desempeño para soportar el diagnóstico de masas (nódulos) 
han sido reportados muy bajos, con una sensibilidad que varía entre 
el 54 al 72% [11, 12]. La baja sensibilidad de los CAD comerciales 
y sus altas tasas de presencia de falsos positivos han reducido la 
confianza del radiólogo en estos sistemas [12]. La mayoría de los 
CAD están diseñados para producir una opinión sobre la presencia o 
no de cáncer, pero su análisis se basa únicamente mediante el pro- 
cesamiento de la información de una sola proyección mamográfica, 
pudiendo ser ésta, la proyección Medio Lateral Oblicua (MLO) o la 
proyección Cráneo-Cudal (CC) de la misma mama, mientras que 
el protocolo clínico en los escenarios reales, el flujo de trabajo del 
radiólogo durante la interpretación de las lesiones mamográficas se 
basa en el análisis del hallazgo obtenido en las dos proyecciones, 
MLO y CC, para así determinar las características relevantes pato- 
lógicas de la lesión y emitir un adecuado diagnóstico. Esto debido 
a la alta variabilidad de las características radiológicas que pueden 
presentar los hallazgos anormales vistos en diferentes proyecciones. 
Debido a que los sistemas CAD solo analizan una proyección, el uso 
clínico de este tipo de herramientas sigue siendo muy limitado, ya 
que la evidencia no es concluyente y, a veces, incluso contradictoria. 
Varios investigadores han descubierto que los sistemas CAD pueden 
aumentar la detección de las etapas iniciales de la enfermedad [13], 
mientras que otros informaron que, en un entorno de detección bien 
establecido, el uso de dichos sistemas no ayudó significativamente a 
mejorar la detección del cáncer [12]. 

Por lo tanto, varios estudios han intentado mejorar el rendi- 
miento de los sistemas CAD, especialmente en el caso de análisis de 
masas [9, 14]. En la literatura, se han reportado varios algoritmos 
automáticos para segmentación y caracterización de masas dirigidos 
a tareas de clasificación como benignas o malignas [15, 16, 14, 171, 
reportando resultados con valores de AUC, área bajo la curva ROC, 
de aproximadamente 0.8 al combinar diferentes tipos de caracterís- 
ticas de bajo nivel [17]. Típicamente, los descriptores de bajo nivel 
aplicados en mamografías son construidos mediante la extracción de 
las características morfológicas y de textura de las lesiones mamarias, 
previamente seleccionadas por el radiólogo. Entre la gran cantidad de 
enfoques reportados en la literatura se encuentran algunos descripto- 
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res basados en los momentos de Zernike, los cuales se han utilizado 
para caracterizar formas y márgenes de masa previamente segmen- 
tadas y contenidas en regiones de interés [18, 19]. Además, los 
momentos de Zernike se han usado ampliamente en diferentes tipos 
de aplicaciones como un descriptor general de forma [20, 21, 22, 23] 
en masas bien definidas [18]. Del mismo modo, se han utilizado una 
gran variedad de técnicas de procesamiento de imágenes basadas 
en información estadística, estructurales y espectrales para analizar 
mamogramas [24], incluido el análisis por matrices de coocurrencia 
[25], dimensiones fractales [26, 27], wavelets [28, 29], curvelets [30] 
y contourlets [31, 32], mostrando un rendimiento muy variable. 
Todos estos enfoques abordan el problema de clasificar una 
masa como maligna o benigna. Sin embargo, en la mayoría de los 
sistemas CAD se ignoran las diferencias visuales que pueden pre- 
sentar la misma masa vista en varias proyecciones por lo que han 
limitado su análisis a las características visuales únicas en una única 
proyección, las cuales son evaluadas de forma independiente. Por 
lo tanto, la información entre las múltiples proyecciones o vistas 
complementarias de la misma mama, desafortunadamente no es 
considerada. La figura 2 ilustra la diferencia entre las características 
visuales de una misma masa observada en diferentes proyecciones. 
Este hecho presenta como resultado inexactitudes y una alta 
incidencia de tasas de falsos positivos (PF). Recientemente, se ha 
propuesto el uso de información de las dos proyecciones mamográ- 
ficas para mejorar el rendimiento del CAD respecto a una sola pro- 
yección. Hasta ahora, los sistemas CAD tradicionales se utilizan para 
identificar regiones mamográficas sospechosas en cada proyección 
por separado, de las que se extraen las características morfológicas 
y de textura. Estas características se utilizan luego para determinar 
la correspondencia entre el par de regiones extraídas de las dos 
proyecciones de la mama, ya sea utilizando diferentes clasificado- 
res discriminativos, como el análisis discriminante lineal (LDA) y 
el k-vecino más cercano (K-NN). Estos enfoques demostraron una 
capacidad para discriminar entre correspondencias verdaderas y fal- 
sas, reduciendo los falsos positivos reportados por el uso de un siste- 
ma CAD de una única proyección. Aunque el uso de información de 
múltiples proyecciones ha demostrado ser útil para mejorar la detec- 
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ción de masas mamográficas, sin embargo, estos enfoques dependen 
en gran medida de una segmentación precisa de la lesión, un desafío 
difícil durante el análisis de masas con límites no definidos. 





A 1534 _1.LEFT_CC_MASS 
IRREGULAR _ILL_DEFINED 
MALG 4 4 2.pgm 


A 1534 1.LEFT MLO MASS 
IRREGULAR _ILL_DEFINED 

MALG_4 4 2.pgm 
Figura 2. Caso de estudio mamográfico: a) Ilustra una Rol con una masa 
extraída de la proyección MLO de la mama izquierda b) Ilustra una Rol 


con la misma masa extraída de la proyección CC de la mama izquierda 


Este artículo presenta un método que clasifica automática- 
mente las masas como benignas o malignas contenidas en mamo- 
grafías multi-vista. En lugar de llevar a cabo una segmentación 
completa de la lesión, la descripción automática se basa en una 
caracterización multi-resolución y multi-escala de la región de inte- 
rés (Rol) extraída de al menos dos proyecciones MLO y CC, así cada 
Rol es proyectada sobre dos espacios de transformación diferentes 
definidos, el primero por los momentos de Zernike y el segundo por 
la transformada Curvelet, respectivamente. Finalmente, esta infor- 
mación heterogénea es fusionada mediante una estrategia de apren- 
dizaje de múltiples kernels (Multiple Kernel Learning) construida 
por un entrenamiento con máquinas de soporte vectorial (SVM). En 
trabajos anteriores se ha mostrado el potencial de las características 
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de multi-resolución como descriptores de masas en una proyección 
mamográfica [33, 34, 35] y en este artículo se amplía estos trabajos 
generalizando la representación y aprendiendo de las características 
relevantes extraídas de cada proyección para finalmente correlacio- 
nar dicha información, logrando así construir un único descriptor 
extraído de las dos proyecciones. 

Las principales contribuciones de este trabajo se resumen a 
continuación: 


1. Una nueva caracterización de masas mamográficas tomadas de 
dos proyecciones diferentes y que fusiona dos bases complemen- 
tarias de descomposición multi-resolución, el análisis piramidal 
de los momentos de Zernike, una base ortogonal compleja y la 
transformada Curvelet, una descomposición multi-escala ade- 
cuada para capturar mezclas complejas de líneas curvas. 

2. Un método que integra varias proyecciones del mismo hallazgo 
mamográfico para clasificar su nivel de severidad (maligno/ 
benigno) acorde al protocolo clínico real radiológico. 


El resto de este artículo está organizado de la siguiente mane- 
ra: en la siguiente sección se resume una revisión de la literatura de 
trabajos previos desarrollados para clasificar masas según un análi- 
sis ipsilateral. En la sección 3, se describe el método propuesto. La 
sección 4 presenta los resultados experimentales, y la última sección 
está dedicada a discusiones y conclusiones. 


2. Materiales y métodos 


En la figura 3 se ilustra el esquema de trabajo del método 
propuesto. Inicialmente, el radiólogo experto selecciona, de forma 
manual, una masa, la misma que está contenida en las dos vistas 
mamográficas (MLO y CC) de la misma mama, como Regiones de 
Interés, entonces la estrategia comienza aplicando una etapa de 
pre-procesamiento para cada una de las Regiones de Interés seleccio- 
nadas, una vez que se han mejorado algunos detalles visuales, la infor- 
mación correspondiente a la forma y textura de la masa, es extraída 
usando los momentos de Zernike y la transformada Curvelet. Esta 
información es combinada usando una estrategia de aprendizaje por 
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múltiples kernels (Multiple Kernels Learning) asignando pesos según 
la relevancia de las características visuales en tareas de clasificación, 
un procedimiento que se logra mediante un entrenamiento basado en 
máquinas de soporte vectorial (SVM). Una vez que las regiones son 
caracterizadas, estas son clasificadas como benigna o maligna. 


Base de datos con Rol 


MLO . cc 
Rols a Clasificar 








J ) 
y ) 


Multi-class MKL 


sv vz - van 





Clasificador SVM 
Benigno / Maligno 


Figura 3. Esquema general de la estrategia propuesta 


A. Preprocesamiento de mamografías 


Inicialmente, las mamografías usadas en este trabajo fueron 
normalizadas mediante una estrategia de conversión de escala 
de grises hasta los 8-bits de profundidad [36]. Para este efecto, 
únicamente se seleccionaron mamografías que contenían algunas 
masas con un diámetro estimado hasta de 2 cm, las mismas que 
corresponden a una región cuadrada (Rol) de 512x512 pixeles, las 
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cuales son más probables a desarrollar cáncer en tapas tempranas 
y mucho más difíciles de diagnosticar [37]. Fundamentalmente, se 
ha demostrado que los radiólogos integran la información visual 
percibida a varias escalas y diferentes frecuencias [38]. En el caso 
particular de las masas, el análisis mamográfico integra información 
de los bordes y patrones espaciales locales en diferentes escalas y a 
diferentes orientaciones. Inspirado en estos estudios, en el presente 
trabajo se ha explorado dos representaciones complementarias que 
describen las lesiones mamográficas de manera global (descriptor 
de forma) y de manera local (descriptor de textura). Para el primer 
caso, se propone un análisis piramidal de los momentos de Zernike 
con el propósito de capturar información esencial correspondiente 
a la forma de la masa y una descomposición mediante Curvelets a 
diferentes escalas y orientaciones para capturar información de dife- 
rentes lineas curvas y patrones de textura, pero para cada descriptor 
fue necesario un pre-procesamiento diferente, los mismos que se 
describirán a continuación:. 


B. Descriptor de forma de masas: análisis por los momentos de 
Zernike 


La forma de las masas ha sido reportada entre los signos radio- 
lógicos más importantes [39, 6, 40] y los momentos de Zernike se 
han usado clásicamente como buenos descriptores para caracterizar 
formas [20, 22]. Los momentos de Zernike se derivan de un con- 
junto de polinomios ortogonales complejos, proyectados dentro del 
círculo unitario [41, 42], los mismos que son expresados en coor- 
denadas polares y calculados desde un conjunto de polinomios de 
Zernike, tal como: 


Vo, (1,0) = Ro g(rJe!%,r € [-1,1] (1) 


donde, p representa el orden del polinomio y q sus repeti- 
ciones (frecuencias). Así, el orden p es un interno no negativo y 
la repetición q es un entero positivo o negativa, de tal manera que 
satisface la condición p—|q| es un número par y |q|<p. Los polino- 
mios radiales con valores reales están dados por: 
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p 
Ry, (1) = y Bpjanr*e/9 (2) 
k=q 


donde, r= Vit? es la dd del vector 0 = tan” O y su 
ángulo, y sus coeficientes B,¡,¡. están dados por: 


ME id ya 3) 
* as 


Estas funciones a permiten descomponer una ima- 
gen f(x,y) como una suma ponderada de los polinomios de Zernike, 


B 


tal como: y . Py da Ly, Vo, q, donde Z, Son los momentos de Zer- 


nike de orden p, con q repeticiones. Esta relación expresada en tér- 
minos discretos, en donde una imagen digital de tamaño NxN es 
proyectada dentro del espacio de Zernike contenido por todas las 
funciones polinomios ortogonales, se presenta como: 


Z 


Voq (, y)f (<, y) (4) 


p+1 
Lpg = a 


1 

x=0 y=0 

Donde, A=0A/1 es una constante de normalización y OA es el 

área de la imagen cuando es proyectada sobre el circulo unitario de 
los polinomios de Zernike. 

Como un primer paso, se aplicó el método propuesto en [35], 
para resaltar las características de forma de la masa, el cual consistió 
en cuantificar el rango dinámico del histograma de nivel de grises 
original en 12 bins dentro del intervalo de [0,255]. Para tal efecto, 
se asigna una Rol particular al círculo unitario haciendo coincidir el 
centroide de la Rol y el círculo unitario. De esta manera, se calcu- 
laron los momentos de Zernike de 45% hasta el 50% orden, siendo 
estos valores los suficientes para reconstruir la forma original con 
una relación-señal a ruido pico, PSNR (Peak Signal-to-Noise Ratio), 
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mayor a 40:dB. Del mismo modo, este orden seleccionado evita 
cualquier inestabilidad numérica producida por la presencia de altas 
frecuencias de la imagen, tal como se ha demostrado en [35], siendo 
esta una limitación de los polinomios de Zernike producidos por la 
discretización de estas bases continuas. En este trabajo los errores 
numéricos y geométricos producidos por el uso de esta estrategia se 
corrigieron como se muestra en [42]. Finalmente, este principio de 
extracción de características se aplicó para las dos regiones desde las 
vistas MLO y CC, para finalmente construir un vector de característi- 
cas general mediante la concatenación del histograma normalizado 
de acuerdo a las frecuencias (repeticiones) para cada uno de los 
cinco órdenes (45 a 50) de los momentos de Zernike, obtenidos por 
cada Rol en las diferentes vistas. 

Por otro lado, los efectos producidos por la invarianza a la 
traslación y escalado de la imagen se evitan mediante la aplicación 
de una técnica de normalización como se describe en [43], al centrar 


y escalar el marco de referencia (x,y) a E + e + y), siendo (x,y) 





/ 
el centroide f(x,y) y a=/ P/ Mog el factor de escala, con [ el número 
de pixeles en la masa obtenida al binarizar el Rol y m,, el momento 
geométrico de orden cero. 

Clásicamente, las representaciones de formas tomadas desde 
los primeros cinco órdenes de los polinomios de Zernike han sido 
usados como una aproximación a las aberraciones ópticas produci- 
das por el ojo humano [19, 18], ignorando los coeficientes de orden 
alto ya que, dependiendo del tamaño de la imagen, un cálculo sim- 
ple para los primeros 40 momentos pueden tomar una hora [42]. 
Sin embargo, con la estrategia propuesta en este trabajo, el costo 
computacional se reduce drásticamente en la fase de pre-procesa- 
miento, los momentos hasta el orden cincuenta pueden calcularse 
en menos de 5s. Además, este subconjunto de momentos también 
se seleccionó para obtener una representación de las características 
globales de masas (ver figura 4). 
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Figura 4. Descomposición piramidal mediante los momentos de Zernike 
(frecuencia vs. orden): a) Ilustra los coeficientes de Zernike hasta 
el orden 50 de la imagen original. b) Ilustra una Rol con una masa 
extraída de la proyección CC 


C. Caracterización por la transformada Curvelet 


La transformada Curvelet realiza una descomposición multies- 
cala [44] utilizando un conjunto de bases estadísticamente depen- 
dientes. En donde cada Rol de las proyecciones MLO y CC, son des- 
compuestas para capturar su información de acuerdo a diferentes 
escalas, de igual manera, cada una de estas bases Curvelet captura 
su orientación asociada. Esta transformación, en particular, limita 
cada escala mediante la ley de escalamiento anisotrópico parabólico 
[44], asegurando que la forma de masa y los patrones de textura se 
conserven a diferentes escalas. Varias investigaciones han demostra- 
do que Curvelet es un descriptor de textura adecuado en diferentes 
bases de datos públicas con imágenes de textura [45], mientras que 
otras han demostrado que Curvelets supera las transformadas como 
wavelets o Gabor en tareas de clasificación [32, 46]. En el dominio 
de la frecuencia, un Curvelet se construye como el producto de dos 
ventanas: una angular y las coronas radiales diádicas. La ventana 
angular representa el análisis direccional y la ventana diádica radial 
es un filtro pasa-banda con frecuencias de corte que siguen la ley de 
escalado anisotrópico parabólico widh=length* [44]. Debido a esta 
propiedad anisotrópica, los Curvelets se adaptan mucho mejor a 
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las curvas a diferentes escalas que otras transformaciones y, por lo 
tanto, resultan muy resistentes al ruido en las imágenes. La figura 
5 ilustra la descomposición mediante la transformada Curvelet de 
una Rol. 

El pre-procesamiento para este caso particular de extracción 
de características, busca preservar los patrones principales de textu- 
ra y definir un nivel comparable de intensidad, para ello, un filtro 
basado en la mediana fue aplicado, suavizando la Rol de cada pro- 
yección (MLO y CC), mientras que con un ajuste adaptativo del his- 
tograma [47] se lograron resaltar los patrones de textura principales 
y conserva los bordes importantes, como se ilustra en la figura 6. 


Coarse 
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Original Rol 


(b) (c) 


Figura 5. Descomposición multi-resolución mediante la transformada 
Curvelet de una Rol a diferentes escalas y orientaciones 


Luego de que las dos regiones de interés Rol de las dos proyec- 
ciones fueron descompuestas en cuatro escalas con 32 orientaciones, 
para un total de 128 sub-bandas. El descriptor basado en curvelets 
se construyó concatenando versiones normalizadas de los coefi- 
cientes curvelets extraídos de las diferentes subbandas, es decir, 32 
orientaciones en las cuatro escalas por la Rol de la proyección MLO 
y la región de la proyección CC. Para este caso particular y con el 
propósito de definir la similitud para este tipo de descripción, se ha 
implementado una medida de similitud basada en la Intersección de 
Histogramas. La transformada Curvelet fue implementada mediante 
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la transformada rápida de Fourier desigualmente espaciada, con una 
ventana rectangular inclinada a lo largo de la dirección principal de 
cada curvelet, como es presentado en [44] 
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Figura 6. Etapa de procesamiento mediante un filtro de mediana y 
ajuste adaptativo del histograma. a) Ilustra una Rol original con una 
masa, b) Ilustra una Rol procesada con un filtro de mediana, c) Ilustra 
la Rol mejorada por ajuste adaptativo del histograma 


D. Fusión de descriptores multiresolución 


Una vez que se realizaron los análisis de Zernike y Curvelet 
para cada Rol (MLO y CC), se aplica una estrategia de fusión de 
información con el propósito de encontrar una forma óptima de 
combinar la información obtenida de estas dos fuentes de repre- 
sentación. Específicamente, la fusión propuesta intenta encontrar 
valores óptimos para los parámetros que maximizan la capacidad 
discriminativa para las clases maligna y benigna de una masa. Una 
estrategia común es ponderar los espacios de características (des- 
criptores Zernike y Curvelets) y luego sumarlos para calcular una 
caracterización óptima, tal como [48]: 


$(x) = y» 0045? (x) (5) 
$ 


El problema con esta estrategia es que la información importan- 
te de las características individuales puede perderse cuando se com- 
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binan de manera lineal los espacios de características. Por lo tanto, 
la fusión propuesta en este trabajo usa una estrategia diferente que 
mantiene toda la información de los dos espacios de características 
y solo los fusiona cuando se necesita tomar una decisión. Específica- 
mente, los espacios de Zernike y Curvelet se utilizan como entrada 
para una función discriminante, DW(), que indica a qué espacio 
pertenece un determinado valor de x para una clase en particular: 


Di) = (w, (+ (S*G0), Po (SI*I(O))) (6) 


Donde, WER!?!*M=N es el vector de parámetros que indica la 
importancia relativa del vector de características extraído de cada 
espacio S*(x) y Y, pe Ed es la función que mapea cada des- 
criptor S*(x) para in espacio de características E El valor de D ,(x) 
es esperado a satisfacer D(x)>0 sí x corresponde a una específica 
clase y D,(x)<0 sí x no es parte de esa clase. Esta formulación tie- 
ne la ventaja de mejorar la flexibilidad permitiendo que el modelo 
tenga en cuenta interacciones no-lineales potencialmente complejas 
entre los valores de un espacio único original correspondiente a 
características en diferentes escalas. 

Considerando que solo dos espacios de características diferen- 
tes deben ser óptimamente fusionados, dos funciones Y, específica- 
mente la función Y, y Y, son encargadas de mapear los descriptores 
a un nuevo espacio de características, donde los patrones complejos 
no-lineales se vuelven lineales. Esta estrategia es bien conocida 
como kernel trick y es usada con métodos de kernels, donde el 
mapeo Y, y Y, es implícitamente inducida por una función kernel. 
Así, una función kernel k:XxX=R asociado a un mapeo Y, oe 
tal queV x,y € X,k(x,y)<Y, (x),Y, (y)>F, ¡.e., k calcula el producto 
punto en F. De esta manera, un Kernel suele ser visto como una 
función que mide la similitud entre dos objetos desde un espacio de 
características. En este trabajo, el espacio de características de entra- 
da puede ser el espacio de las Curvelets y los momentos de Zernike 
que son fusionados, entonces la función kernel mide la similitud en 
esos espacios particulares. 

Esto es formulado como problema de maximizar y minimizar 
el siguiente problema de discriminación: 
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N 

min C Y max(0,1 — y¿Dy (20) + III (7) 

i=1 

donde, x, representa una Rol de entrenamiento, y €f-1,1) 
representa la clase correspondiente, N es el número de muestras 
usadas en el entrenamiento, y C controla la regularización del mode- 
lo. El primer término de la función objetivo en la ecuación 7 es una 
función de pérdida que penaliza la clasificación incorrecta de las 
muestras de entrenamiento y el segundo término es el regularizador 
del parámetro W. La regularización de W está asociada con la bús- 
queda de un máximo margen del clasificador de la misma manera 
como funciona para la clasificación mediante máquinas de soporte 
vectorial [49]. En este trabajo, el parámetro C fue de 1000 después 
de una búsqueda exhaustiva del valor óptimo bajo una estrategia de 
entrenamiento mediante una validación cruzada con 10 sub-grupos 
de datos, conocida como “10-fold cross validation”. 

Entonces, considerando las funciones Y, y Y,, en este trabajo 
se usó la intersección de histogramas como una función kernel, la 
cual es definida como: 


Y, = kKui(Sp50)= Y)» mintsp())s/(5))) 
J 


Í 


lo cual requiere que los momentos de Zermike sean normali- 
zados entre valores de O a 1. Así, el modelo propuesto fusiona los 
diferentes espacios combinando sus respectivos kernels, en lugar de 
directamente sumar los mismo espacios. El problema de optimiza- 
ción en la ecuación 7 es por lo tanto tratado como un problema de 
aprendizaje basado en múltiples kernels, conocido como Multiple 
Kernel Learning (MKL), con el cual se busca un buen hiper-plano 
discriminante en el espacio fusionado. Varias formulaciones basadas 
en MKL han sido desarrolladas últimamente, la estrategia usada en 
este trabajo se basa en la propuesta por [50], Aprendizaje Generali- 
zado basado en Multiples Kernel (GMKL). 


Clasificación automática de nódulos mamográficos basada en fusión de información visual multi-vista 


E. Clasificación de masas 


Esta etapa de clasificación consiste en establecer sí una nueva 
masa seleccionada por el radiólogo, en las dos vistas (MLO y CC), 
corresponde a una masa maligna o benigna de acuerdo a los crite- 
rios establecidos por el sistema BI-RADS. Una vez que las Rols se 
asignan a los dos espacios diferentes como se describió hasta ahora, 
las diferentes representaciones alimentan un clasificador binario 
SVM (Support Vector Machine) que utilizan sus kernels pre-calcu- 
lados basados en la intersección del histograma como medida de 
distancia. Este clasificador para discriminar entre las dos clases, la 
clase benigna y maligna, asume como valores positivos y negativos 
para cada clase respectivamente, lo cual es determinado por el signo 
de la siguiente función discriminante [51]: 


_ W;¡.x+b, 


f: = 
will 


donde w, y b. son la normal y el peso hacia el hiper-plano 
relacionado a el 1" clasificador. Por lo tanto, dada las dos Rols x, el 
conjunto de clase c.= ¿benign,malign). es asignado de acuerdo al 


sign: (f.0c)) 


A E (8) 


E Medidas de Evaluación 


En tareas de clasificación, el clasificador debe asignar una eti- 
queta (clase) de una colección de posibilidades finita y mutuamente 
exclusivas y, por lo tanto, cada instancia estará asociada a una sola 
clase. Esto generalmente se encuentra en la literatura como el méto- 
do de relevancia binaria [51] por lo que se han utilizado diferentes 
medidas de desempeño. En este trabajo, el desempeño es evaluado 
en términos de la exactitud (accuracy), sensibilidad, especificidad y el 
área bajo la curva (AUC) de la curva RoC (Receiver Operating Cha- 
racteristic) que es una representación gráfica de la sensibilidad fren- 
te a la especificidad para un sistema clasificador binario de acuerdo 
el umbral de discriminación. Estas medidas son definidas como: 
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TPRIN 


ACUSE PATNF FRAN 

Sensibilidad = TPR = de 10 

ensibilidad = = TPF FP (10) 
E ificidad = EN 11 
specificidad = TN + FN (11) 


donde TP, TN, FP y EN, denotan la cantidad de verdaderos 
positivos, falsos negativos, falsos positivos y falsos negativos, res- 
pectivamente, obtenidos de dicha tarea de clasificación. En conse- 
cuencia, se entrenó y evaluó el esquema de clasificación SVM, para 
el cual se determinaron los parámetros de clasificación durante la 
etapa de entrenamiento mediante una validación cruzada con 10 
particiones de datos (10-fold cross validation). 


G. Descripción de las bases de datos 


La estrategia propuesta es evaluada utilizando diferentes nive- 
les de calidad de imágenes mamográficas, una versión digitalizada de 
mamografías de placa (screen-film) y mamografías digitales de cam- 
po completo. Para esto, se usan dos bases de datos diferentes de domi- 
nio público, la Base de datos digital para la detección de mamografías 
(DDSM)! y la base de datos INBreast?, de las cuales fueron extraídos 
dos conjuntos de Rols de las vistas MLO y CC, respectivamente. Una 
breve descripción para cada conjunto de datos se muestra debajo. 


e Base de datos DDSM: la base de datos digitalizada para tami- 
zaje de mamografía (DDSM) [52] es una base de datos con 
imágenes mamográficas ampliamente usada en esta área de 
investigación como punto de referencia de evaluación [53, 54, 
55]. Esta base de datos de libre acceso está constituida por 
imágenes digitalizadas de películas mamográficas con su infor- 


1 http://marathon.csee.usf.edu/Mammography/Database.html 


2 http://medicalresearch.inescporto.pt/breastresearch/index.php/Get_INbreast_ 
Database 
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mación técnica y diagnóstico clínico correspondiente. Toda la 
base de datos DDSM contiene un total de 2620 casos, cada uno 
incluye cuatro imágenes obtenidas de las vistas Cranio-Caudal 
(CC) y Mediolateral-Oblicua (MLO), así como una descripción 
específica de acuerdo al sistema BI-RADS, y que fueron anota- 
das por radiólogos expertos según BI-RADS cuarta edición. En 
esta investigación, se eligió un subconjunto de mamografías, 
las mimas que cumplieron los siguientes criterios de inclusión: 
1) similar calidad de imagen, 2) número equilibrado del tipo 
de masas (benignas/malignas), 3) solo se evaluó una sola 
lesión, es decir, este estudio excluyó masas con calcificacio- 
nes, distorsión arquitectural o casos con la presencia de clips 
o marcas de metal en el área de masa. Por lo tanto, fueron 
seleccionadas un subconjunto de mamografías digitalizadas 
con un escáner láser Lumisys a 50um o un escáner Howtek 
a una resolución de 43.5um píxeles y con un rango dinámico 
de intensidades de = 4096 niveles de tono de grises. Luego, 
un proceso de extracción de la Rol fue llevado a cabo. Para lo 
cual se consideró la información relacionada a la ubicación y 
tamaño de la masa de cada caso, permitiendo recortar manual- 
mente subimágenes cuadradas considerando como centro las 
masas. Debido a que las anotaciones proporcionadas en la 
base de datos DDSM incluyen el límite de la segmentación de 
los hallazgos, en este trabajo el tamaño de las Rols se definió 
como un cuadrado de nxn pixeles. Específicamente, las Rol 
se recortaron según el cuadro delimitador de las lesiones y 
se redimensionaron a nxn píxeles conservando la relación de 
aspecto cuando el ancho o la altura del cuadro delimitador 
son mayores que n; en otros casos, la lesión se centra sin esca- 
lar y se preservan los tejidos de fondo. En consecuencia, un 
conjunto de 980 regiones de interés fueron extraídas de esta 
base de datos DDSM incluyendo vistas CC y MLO, distribuidas 
como 490 regiones de interés con masa de la vista MLO y 490 
regiones de interés de la vista CC de la misma mama. 

e Base de datos INBreast: una evaluación adicional fue lleva- 
da a cabo usando los casos almacenados en la base de datos 
INBreast [56]. Esta base de datos contiene mamografías en 
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formato DICOM y fueron adquiridas del Hospital de Sáo Joao, 
Breast Centre, Porto, Portugal. Esta colección de casos incluye 
masas, calcificaciones, asimetrías bilaterales y distorsión arqui- 
tectural. En este trabajo, se seleccionaron un total de 108 cases 
(216 imágenes) que constituyen esta base de datos, de los cua- 
les 108 casos son documentados ipsilateralmente (4 imágenes 
por caso) y 25 son de pacientes con mastectomía (2 imágenes 
en estos casos). En consecuencia, un conjunto de 108 masas 
fueron extraídas por cada vista MLO y CC. La localización y el 
tamaño de las masas, asociadas a cada caso, fueron tomados 
de los contornos dibujados por los expertos y proporcionados 
como información en formato XML. 


3. Resultados 


El método propuesto fue evaluado dos veces. Primero, para la 
tarea de clasificar Rols de entrada tomadas de la base de datos DDSM 
y determinar sí corresponde a la clase benigna o maligna. En segun- 
do lugar, la evaluación fue llevada a cabo con las Rols tomadas de la 
base de datos INBreast para la misma tarea de clasificación. En ambos 
casos, se evaluó el desempeño del método de fusión de información 
de las dos proyecciones (MLO y CC) respecto a la clasificación obte- 
nida por cada vista. El proceso de evaluación experimental fue imple- 
mentado en MATLAB R17, ejecutado en una PC Linux con 2 Intel 
Quad Core 17 a 3.07 GHz y 24 GB de RAM. Todos los experimentos 
fueron implementados y basados en el código fuente de Generalized 
Multiple Kernel Learning (GMKL), así como, la implementación de la 
estrategia Multiple Kernel Learning [50], mientras que el clasificador 
SVM fue implementado usando la librería de código abierto LIBSVM 
[57], con matrices de distancia como kernels pre-calculados. 


A. Base de Datos DDSM 


La primera evaluación del método consistió en comparar el 
poder discriminante del esquema de fusión de información obtenida 
de las dos proyecciones MLO y CC frente a la caracterización de la 
misma masa únicamente vista en cada proyección por separado, 
para tal efecto, una misma masa fue caracterizada mediante los 
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espacios de Zernike y Curvelets en la proyección MLO y CC. Esta 
evaluación permitió determinar el rendimiento del esquema de 
fusión propuesto frente a imágenes con calidad variable, como es el 
caso de las imágenes de la base de datos DDSM. En esta evaluación 
se usaron 980 Rols extraídas de la base de datos DDSM (490 MLO y 
490 CC). Por lo tanto, en esta evaluación se comparó el desempeño 
obtenido con la proyección medio lateral oblicua (MLO), proyección 
cráneo caudal (CC) y la estrategia de fusión de las dos proyecciones 
(MLO-CC). Las dos espacios de características se usaron como entra- 
das para un clasificador SVM binario clásico con matrices de kernel 
pre-calculadas. Para el proceso de entrenamiento se llevó a cabo 
una partición de 70-30 muestras, para entrenamiento se seleccionó 
el 70%, mientras que el 30% restante se usó para la validación, un 
proceso que fue repetido 10 veces. Los resultados obtenidos durante 
esta evaluación se presentan en la Tabla 1. 


Tabla 1. Rendimiento promedio según un esquema de validación de 
70-30% para la tarea de clasificar los Rol como benignas y malignas 


para las base de datos DDSM 





MLO-CC —__— 


En general, la fusión de información correspondiente a las 
dos proyecciones (MLO-CC) supera al desempeño logrado por cada 
una de las proyecciones por separado MLO y CC, respectivamen- 
te, alcanzando una sensibilidad del 96.3% frente 85.3% y 82.2% 
correspondiente a la proyección MLO y CC, mientras las especifici- 
dades alcanzada de 93.1 fue superior a 83.2% y 80.4% alcanzados 
por cada proyección por separado. Además, las métricas Accuracy y 
AUC muestran resultados notables, con 97.8 y 0.95 para esa base de 
datos. Finalmente, estos resultados pueden ser observados mediante 
las curvas ROC, los cuales se ilustran en la figura 7 
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Curva ROC 


tue positive rate 


——— baseline 





0 0.2 0.4 0.6 0.8 1 
false positive rate 


Figura 7. Curva ROC correspondiente al desempeño de la estrategia 
de fusión propuesta (MLO-CC) respecto a la clasificación usando 
información de una única vista MLO y CC, respectivamente 


B. Base de Datos INBreast 


En esta evaluación, se midió el desempeño de la estrategia 
propuesta en imágenes digitales DICOM con la misma calidad. De 
igual manera, esta evaluación consistió en comparar el poder dis- 
criminante del esquema de fusión de información obtenida de las 
dos proyecciones MLO y CC frente a la caracterización de la misma 
masa únicamente vista en cada proyección por separado. En esta 
evaluación se usaron 216 Rols extraídas de la base de datos INBreast 
(108 MLO y 108 CC). De igual manera, se comparó el desempeño 
obtenido con la proyección medio lateral oblicua (MLO), proyección 
cráneo caudal (CC) y la estrategia de fusión de las dos proyecciones 
(MLO-CC). Las dos espacios de características se usaron como entra- 
das para un clasificador SVM binario clásico con matrices de kernel 
pre-calculadas. Para el proceso de entrenamiento se llevó a cabo 
una partición de 70-30 muestras, para entrenamiento se seleccionó 
el 70%, mientras que el 30% restante se usó para la validación, un 
proceso que fue repetido 10 veces. Los resultados obtenidos durante 
esta evaluación se presentan en la Tabla 2. 
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Tabla 2. Rendimiento promedio según un esquema de validación de 
70-30% para la tarea de clasificación de Rols con masas benignas y 
malignas de la misma mama (base de datos INBreast) 













INBreast 
MLO-CC mo | cc 


En este caso particular con la base de datos INBreast, los resul- 
tados reportados demuestran que la fusión de información de las 
dos proyecciones (MLO-CC) supera al desempeño logrado por cada 
una de las proyecciones por separado MLO y CC, respectivamen- 
te, alcanzando una sensibilidad del 98.1% frente 87.2% y 85.3% 
correspondiente a la proyección MLO y CC, mientras las especifici- 
dades alcanzada de 95.6 fue superior a 83.3% y 81.2% alcanzados 
por cada proyección por separado. Además, las métricas Accuracy y 
AUC muestran resultados notables, con 97.2 y 0.98 para esta base de 
datos. De igual manera que en el experimento anterior, los resulta- 
dos de esta evaluación pueden ser visualizados mediante las curvas 
ROC, los cuales se ilustran en la figura 8. 







4. Discusión 


En este trabajo se ha propuesto un método novedoso que 
fusiona información visual completamente obtenida desde dos vistas 
diferentes de la misma masa para su clasificación entre benigna o 
maligna de acuerdo al criterio establecido en el sistema BI-RADS, 
comportándose como un modelo que se acerca al flujo de trabajo real 
de los radiólogos en escenarios clínicos reales, a la vez que cumple el 
requisito importante para ser implementado en cualquier sistema de 
soporte CAD. La importancia de esta estrategia se fundamenta en un 
par de descripciones complementarios multi-resolución, los mismos 
que se fusionan de manera óptima en un marco adaptable de apren- 
dizaje basado en múltiples kernels. 
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Figura 8. Curva ROC correspondiente al desempeño de la estrategia 
de fusión propuesta (MLO-CC) respecto a la clasificación usando 
información de una única vista MLO y CC, respectivamente 


En este trabajo se aprovecharon las características visuales 
variables que pueden presentar entre una y otra proyección para refi- 
nar su clasificación, además de aprender del conocimiento implícito 
del radiólogo experto proporcionado sobre la anotación de la imá- 
genes almacenadas en las bases de datos. La evaluación exhaustiva 
ha demostrado que el enfoque actual es altamente confiable para ser 
utilizado en escenarios clínicos reales y con cualquier estrategia de 
CAD para tareas de clasificación. 

Frecuentemente, diferentes métodos para clasificar masas 
como benignas y malignas [15,16,14,17], segmentan la lesión y 
extraen diferentes características cuyo rendimiento para esta tarea 
de clasificación se ha evaluado mediante las curvas ROC o FROC. 
Olivier et. Alabama. [17] proporcionó una comparación cuantitativa 
de siete métodos que comparten algunas estrategias básicas, tales 
como, crecimiento de regiones para localizar la presencia de estruc- 
turas específicas, cluster o agrupamientos de píxeles y modelos de 
detección de contornos específicos que caracterizan lesiones poten- 
ciales. Este conjunto de métodos se evaluó con una parte de la base 
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de datos MIAS y una recopilación de datos privados, solo 261 casos 
que representan un conjunto de datos muy reducido, lo que repor- 
taron áreas bajo la curva ROC de AUC=0.8, sin embargo, el número 
de falsos positivos por imagen alcanzó más de cinco por cada casos. 
Por el contrario, el esquema propuesto basado en fusión de vistas 
MLO-CC fue evaluado con una base de datos compuesta por Rols, 
extraídos de la base de datos DDSM y INBreast obteniéndose valores 
del AUC de 0.98 y 0.95, respectivamente, en la tarea de clasificación 
como benigna y maligna. Así mismo por ejemplo, otros trabajos 
han utilizado diferentes análisis multi-resolución para construir un 
descriptor de bajo nivel. Tahmasbi et. al [18] han demostrado que 
una representación de forma útil, requiere una serie de momentos 
de Zernike [18, 19]. Así, evaluaron los momentos de Zernike cal- 
culados en un orden máximo (orden 17) y los dividieron en dos 
grupos, 32 de orden inferior y 32 de orden superior. La combinación 
de estos dos grupos resultó como el mejor descriptor de forma de 
las masas, reportando un AUC = 0.97 en la tarea de clasificación 
como benignas o malignas, para lo cual, usaron una red neuronal 
como clasificador mediante un algoritmo Perceptron de múltiples 
capas. Este método fue evaluado con la base de datos MIAS, espe- 
cificamente usaron, 209 ROI normales, 67 ROI benignos y 54 ROI 
malignos y la conclusión fue que los momentos de Zernike de bajo 
orden mostraron poca capacidad de discriminación, reportando un 
AUC = 0.59, pero la combinación con órdenes superiores mejoró 
la resultados del método. En contraste, los resultados obtenidos en 
este trabajo superaron este método y fusionaron de manera óptima 
las representaciones de Zernike-Curvelet, con momentos de Zernike 
de orden de 45% a 50, Este conjunto de momentos fue selecciona- 
do debido a que observamos que la mayor parte de la energía de 
los coeficientes se concentraba en este rango y, además, el PSNR 
durante la reconstrucción de la imagen original era mayor de 40:dB. 
De igual manera, Eltoukhy et. al [32] comparó las diferentes trans- 
formaciones wavelet y Curvelet para diferenciar cualquier tipo de 
lesión mamaria, específicamente, masas, calcificaciones, distorsión 
arquitectónica y asimetría bilateral. Para este propósito seleccionó 
un conjunto de 100 coeficientes de cada transformación y fueron 
usados con una estrategia de clasificación mediante los vecinos 
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cercanos K-NN implementado con una métrica Euclideana. Para la 
validación se usaron 322 mamogramas, 51 malignos, 64 benignos 
y 207 normales. Las imágenes fueron descompuestas en cuatro 
niveles diferentes con tres funciones de wavelets diferentes, entre 
estas: Daubechies-8, symlet y bi-ortogonal, mientras que se usaron 
cuatro niveles de descomposición para las curvelets. Los resultados 
demostraron una tasa de clasificación promedio para las 3 clases 
(benigna, maligna y normal) de 94.07% para las Curvelet y 90.05% 
para las wavelets. Posteriormente, estos autores mejoraron sus 
resultados [32], utilizando un esquema SVM y logrando un 96.56% 
con la misma base de datos. Sin embargo, el análisis fue realizado en 
una única proyección de mamografías y su base de datos es mucho 
más pequeña que la utilizada en esta investigación, lo que se puede 
observar que el rendimiento es similar. Asimismo, se han reportado 
diferentes técnicas estadísticas, estructurales y espectrales para ana- 
lizar las mamografías [24], incluidas las matrices de coocurrencia 
[25]. Ramos et.al [25] presentaron una evaluación de los métodos 
basados en Ridgelet, Wavelet, Co-ocurrence y concluyeron que la 
wavelet superó a las otras representaciones, con un AUC de 0.9 
cuando clasificaba las masas como benignas o malignas, resultados 
que han sido mejorados con el método propuesto en este trabajo. 
Una gran ventaja del presente método es que, es comple- 
tamente automático, las evaluaciones mostraron un rendimiento 
notable en diferentes bases de datos, clasificando masas en regiones 
bien definidas y algunas con una pobre calidad de la imagen. La 
estrategia se basa en la fusión óptima de la información visual de 
dos vistas de la misma lesión y proveída por dos descripciones com- 
plementarias cuyos pesos se pueden aprender de la base de datos. 
El tamaño Rol se puede considerar un parámetro importante en los 
resultados y su influencia no se evaluó en este trabajo, sin embargo, 
el hecho de que los descriptores, Zernike y Curvelet, sean por natu- 
raleza una descomposición multi-resolución y multi-escala podrían 
mitigar los efectos causados por la selección de este parámetro. Otro 
limitación del método se debe a la falta de detección automática de 
la masa (Rols) en las dos proyecciones, en este caso las regiones se 
proporcionan como una entrada. Sin embargo, esto podría conside- 
rarse un inconveniente, pero el objetivo de esta investigación fue 
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diseñar una estrategia integrable con un flujo de trabajo de radió- 
logo real y proporcionar alguna ayuda crucial al realizar tareas de 
diagnóstico. Se podría construir un método totalmente automático o 
de detección a partir de la presente estrategia mediante una simple 
búsqueda exhaustiva de toda la mamografía, pero esto estaba fue- 
ra del alcance de la presente investigación. Finalmente, el método 
muestra tiempos de ejecución asequibles del orden de 3-5 segundos. 
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